4.11- Innovaciones en Comunicaciones 6G: Quantum AI, Deep Reinforcement Learning y Beamforming en los THz -

Centro de operaciones futurista con un entorno dinámico, donde dos operadores, monitorean un sistema de Digital Twins (DT) mediante hologramas, destacando enlaces 6G y Quantum AI. — Técnicos futuristas gestionan redes UAV y enlaces mmWave mediante sistemas avanzados de Quantum AI, mientras interactúan activamente con interfaces holográficas y sensores IoT.

21/05/2025

Deep Reinforcement Learning: Impulsando la Conectividad en Redes Avanzadas

El Aprendizaje por Refuerzo, (RL, Reinforcement Learning), ha emergido como una tecnología clave en el desarrollo de soluciones avanzadas para redes dDeep Reinforcement Learning: Impulsando la Conectividad en Redes Avanzadas de comunicaciones 6G, permitiendo la optimización de recursos espectrales, la gestión dinámica del tráfico y la mejora en la calidad del servicio (Xu, Zhang, & Li, 2025). De hecho, mediante el ajuste continuo de políticas basadas en recompensas y penalizaciones, los sistemas basados en aprendizaje RL logran adaptarse a entornos altamente dinámicos, maximizando la eficiencia operativa de las redes vehiculares y de sistemas satelitales avanzados (Arana-Catania, González, & Torres, 2025).

Por otro lado, el Aprendizaje Profundo por Refuerzo, (DRL, Deep Reinforcement Learning), amplía las capacidades del aprendizaje RL al integrar redes neuronales profundas que permiten procesar grandes volúmenes de datos de señales en tiempo real, lo que resulta fundamental en aplicaciones como la detección de GNSS Spoofing y el beamforming adaptativo en frecuencias de los Terahercios (THz) (Sun, Kim, & Lee, 2025). Así, la combinación de aprendizaje DRL con tecnologías emergentes como la Quantum AI no solo optimiza la formación de haces electromagnéticos en entornos de alta frecuencia, sino que también mitiga los efectos de interferencia, latencia y pérdida de señal (Kashikar, 2025).

Además, la implementación de Digital Twins, (DT), ha demostrado ser eficaz en la simulación de redes vehiculares y sistemas IoT (Internet of Things), proporcionando un entorno virtual para el entrenamiento de modelos de aprendizaje RL y DRL sin riesgo operativo en infraestructuras reales (Roy, Bhandari, & Kaur, 2025). En este contexto, los avances en las tecnologías 6G han impulsado la investigación sobre la integración de la Quantum AI en sistemas de comunicación en los THz, permitiendo la configuración dinámica de haces mediante algoritmos de aprendizaje automático que ajustan los parámetros de transmisión en función de las condiciones de los canales y del entorno circundante (Kashikar, 2025).

Centro Futurista 6G: Operaciones Remotas con Quantum AI y Gemelos Digitales

La imagen destacada ilustra con precisión la convergencia tecnológica entre las redes 6G, la inteligencia artificial cuántica (Quantum AI), y los modelos de aprendizaje profundo por refuerzo (DRL), representando un centro de operaciones remoto altamente avanzado. En primer lugar, gracias a la aplicación del aprendizaje por refuerzo (RL), es posible gestionar dinámicamente los recursos espectrales en tiempo real, lo cual es representado por los operadores que, mediante interfaces holográficas, ajustan la transmisión en canales altamente volátiles como los de los Terahercios (THz) y mmWave, optimizando la calidad de servicio.

Por consiguiente, los uniformes de los técnicos futuristas, equipados con sensores IoT, reflejan la integración del Internet de las Cosas (IoT) con sistemas de comunicación ubicuos y autoadaptativos, lo cual permite monitorear redes vehiculares, satelitales y UAV (Unmanned Aerial Vehicles) en entornos urbanos desde ubicaciones remotas. De igual forma, la implementación de Digital Twins (DT) otorga un entorno de simulación tridimensional que replica las condiciones físicas reales, facilitando el entrenamiento de modelos de DRL para decisiones de red sin exponer los sistemas a riesgos operacionales.

Asimismo, se aprecia cómo la técnica holográfica permite a los operadores interactuar con una representación visual de los enlaces y dispositivos en red, un componente esencial en el despliegue de sistemas JCAS (Joint Communication and Sensing), donde la fusión de datos de sensores y canales se optimiza mediante algoritmos DRL potenciados con Quantum AI. En este entorno, los haces de comunicación adaptativos dirigidos a través de antenas UM-MIMO permiten mantener enlaces estables en condiciones dinámicas, a la vez que ajustan los parámetros de emisión para reducir la interferencia y aumentar la relación señal-ruido (SNR).

En paralelo, se destaca cómo el uso de la Quantum AI en conjunto con el algoritmo DDPG-SR permite no solo identificar patrones de interferencia o congestión, sino también reconstruir el estado de red en entornos cambiantes, anticipándose a eventos imprevistos mediante simulaciones predictivas y ajustes instantáneos en el beamforming. De esta manera, se logra una respuesta ultra-rápida ante alteraciones del canal de comunicación, un atributo crítico para redes vehiculares V2V (Vehicle-to-Vehicle) y satelitales altamente sensibles.

Del mismo modo, la presencia visual de enlaces en los THz gestionados con algoritmos DRL evidencia la capacidad de estas tecnologías para operar en bandas de frecuencia poco exploradas, pero extremadamente eficientes, alcanzando velocidades de transmisión de hasta decenas de Gbps. Esto se facilita mediante la utilización de metasuperficies reconfigurables que, controladas por aprendizaje automático, conforman haces omnidireccionales sin partes móviles, simuladas en tiempo real por los sistemas DT.

Finalmente, el centro de operaciones mostrado en la figura, funciona como un nodo estratégico en una red descentralizada de gestión automatizada, donde cada decisión es tomada con base en la predicción de condiciones futuras y la optimización en tiempo real de parámetros de red como el espectro, el retardo y la dirección de los haces electromagnéticos de los enlaces inalámbricos. Así, la escena representa no solo un entorno de control técnico, sino un ecosistema cognitivo que encapsula el futuro de las telecomunicaciones: inteligente, inmersivo y altamente estable.

Introducción al Aprendizaje por Refuerzo (RL) en Redes 6G

Para comenzar, el Aprendizaje por Refuerzo (RL, Reinforcement Learning) constituye una técnica esencial en el campo de la inteligencia artificial, ya que permite a un agente aprender a tomar decisiones óptimas a partir de su interacción con el entorno. En este proceso, el agente emplea un método iterativo de prueba y error, en el cual recibe recompensas o penalizaciones en función de sus acciones, lo que le permite ajustar progresivamente su política de decisiones.

Aplicaciones del Aprendizaje por Refuerzo (RL) en la Robótica y Redes 6G

Así, un caso emblemático del uso de aprendizaje RL se observa en el ámbito de la robótica, donde un agente —en este caso, un robot— aprende a ejecutar tareas como la navegación en entornos complejos o la manipulación de objetos. A medida que el agente explora el entorno, ajusta sus acciones con el objetivo de maximizar la recompensa acumulada a lo largo del tiempo, logrando así un desempeño más eficiente en la tarea asignada (Sutton & Barto, 2018).

Diferencias entre Aprendizaje por Refuerzo (RL) y Otros Métodos de Aprendizaje

De este modo, el Aprendizaje por Refuerzo ha evolucionado hasta convertirse en una técnica avanzada que no solo facilita la toma de decisiones óptimas, sino que también se diferencia de otros métodos de aprendizaje por su enfoque en la retroalimentación obtenida mediante recompensas y penalizaciones. En lugar de basarse en conjuntos de datos estáticos, el agente ajusta continuamente su política de decisiones a partir de la experiencia acumulada en tiempo real.

Optimización del Espectro en Redes 6G mediante RL y DRL

Por ejemplo, en el contexto de las redes 6G, el aprendizaje RL puede aplicarse para optimizar el uso del espectro, mejorar la calidad del servicio (QoS, Quality of Service) y reducir la latencia en aplicaciones críticas (Xu et al., 2025; Arana-Catania et al., 2025).

H3- Digital Twins (DT) en Redes 6G: Simulación Avanzada con Aprendizaje por Refuerzo

Digital Twins (DT) en Redes 6G: Simulación Avanzada con Aprendizaje por Refuerzo

Asimismo, el RL desempeña un papel fundamental en la implementación de Digital Twins (DT, Digital Twins), un enfoque que permite crear representaciones virtuales de sistemas físicos para mejorar la predicción y gestión de redes mediante simulaciones en tiempo real.

Seguridad en Redes Vehiculares mediante Aprendizaje por Refuerzo

Un ejemplo concreto de esta aplicación es el sistema de detección de intrusiones basado en aprendizaje por refuerzo RL, que facilita la predicción y mitigación de amenazas en redes vehiculares, optimizando el uso de los recursos y garantizando comunicaciones seguras (Roy et al., 2025).

Gestión de Recursos en Sistemas Satelitales y UAVs mediante RL

Por otro lado, la integración del RL en sistemas de comunicaciones asistidas por satélites y UAVs (Unmanned Aerial Vehicles) ha permitido gestionar de manera más eficiente los recursos disponibles y optimizar el ancho de banda en entornos de comunicación densa.

Aplicaciones del Rate-Splitting Multiple Access (RSMA) con Aprendizaje por Refuerzo

En un sistema de comunicación basado en RSMA (Rate-Splitting Multiple Access), el aprendizaje RL se ajusta dinámicamente para maximizar la eficiencia energética y minimizar la interferencia entre usuarios (Fatima & Kondamuri, 2025).

Deep Reinforcement Learning (DRL) en Redes 6G: Avances y Aplicaciones

De igual manera, en el ámbito de la 6G, la combinación de aprendizaje por refuerzo RL, con técnicas de aprendizaje profundo (DRL, Deep Reinforcement Learning) impulsa el desarrollo de soluciones avanzadas para sistemas de comunicación y detección conjunta (JCAS, Joint Communication and Sensing). Un caso específico es la implementación de DRL para la detección de GNSS Spoofing (Global Navigation Satellite System) en sistemas de posicionamiento global, donde el sistema aprende a identificar patrones anómalos y generar respuestas adaptativas (Sun et al., 2025).

Detección de GNSS Spoofing mediante DRL en Redes 6G

En cuanto a la detección de GNSS Spoofing en el contexto del 6G, esta adquiere una relevancia creciente debido al incremento de amenazas que comprometen la integridad de los sistemas de navegación satelital. Así, el GNSS Spoofing consiste en la emisión de señales falsas que simulan las legítimas del sistema de navegación global con el objetivo de engañar al receptor y alterar su posición o el tiempo percibido. Por lo tanto, los sistemas avanzados basados en aprendizaje profundo por refuerzo (DRL, Deep Reinforcement Learning) han emergido como soluciones efectivas para identificar patrones anómalos en las señales GNSS. Estos sistemas aprenden continuamente a reconocer discrepancias entre las señales esperadas y las recibidas, generando respuestas adaptativas y mitigando los efectos del spoofing (Ghanbarzade & Soleimani, 2025).

Identificación de Anomalías en Señales GNSS con DRL

En consecuencia, el uso del aprendizaje profundo DRL para la detección de GNSS Spoofing permite implementar modelos que analizan múltiples parámetros de las señales GNSS, tales como la sincronización, la potencia de la señal y los ángulos de llegada. De esta forma, los sistemas basados en DRL pueden identificar discrepancias entre las señales recibidas y los patrones históricos, maximizando así la precisión en la detección de ataques. Asimismo, estos modelos son capaces de adaptarse dinámicamente a nuevas formas de spoofing mediante procesos de retroalimentación y ajuste automático de los parámetros de identificación (Iqbal et al., 2024).

Detección de Spoofing en Redes UAV y Satelitales

Además, en entornos de comunicación avanzada como la tecnología 6G, los sistemas UAV (Unmanned Aerial Vehicles) y las redes satelitales integran arquitecturas basadas en aprendizaje DRL para la detección de spoofing, permitiendo una vigilancia continua del espectro GNSS. De esta manera, el análisis de patrones de señales en tiempo real facilita la identificación temprana de intentos de spoofing, generando alertas y aplicando contramedidas basadas en modelos predictivos y redes neuronales profundas (Wei et al., 2024).

Optimización del Espectro en Redes Vehiculares mediante RL y DRL

Sin duda, la asignación de recursos y la formación de haces en comunicaciones vehiculares en las redes 6G representan áreas clave en las que el aprendizaje RL está generando importantes avances. En estos contextos, las redes vehiculares aplican RL para gestionar de manera óptima los recursos espectrales, manteniendo conexiones de baja latencia en entornos caracterizados por su alta dinámica (Nouri et al., 2025).

Control Dinámico del Espectro en Redes mmWave mediante RL

En este contexto, el aprendizaje RL (Reinforcement Learning) ha encontrado aplicaciones significativas en el control de redes de comunicación, especialmente en el ámbito de las Microondas Milimétricas (mmWave, millimeter Wave). Estas tecnologías, esenciales para la comunicación inalámbrica de alta velocidad, demandan una gestión óptima de los haces electromagnéticos de los enlaces inalámbricos, con el fin de mantener la conectividad. Mediante algoritmos de aprendizaje por refuerzo, se entrena a un agente para seleccionar el haz más adecuado en función de la máxima potencia recibida. Durante la fase de exploración, el agente puede evaluar haces subóptimos con el objetivo de descubrir alternativas potencialmente beneficiosas, mientras que, en la fase de explotación, elige el haz óptimo basado en su experiencia previa (Li et al., 2020).

Redes 6G Basadas en mmWave: Ventajas y Desafíos

Conforme a lo expuesto, el control de redes de comunicación en el ámbito de las Microondas Milimétricas (mmWave, millimeter Wave) ha emergido como una tecnología fundamental en el contexto de las redes móviles 6G. Esta tecnología permite la transmisión de datos a velocidades extremadamente altas mediante el uso de bandas de frecuencia más altas que las utilizadas en generaciones anteriores, lo que facilita tasas de transmisión de gigabits por segundo (Gbps). Un estudio reciente presentado por Vardakas, Soumplis y Kokkinos (2025) en IEEE destaca la implementación de una infraestructura elástica virtual auto-gestionada basada en mmWave para redes 6G sin celdas, utilizando principios de Aprendizaje por Refuerzo (RL, Reinforcement Learning) para optimizar la asignación de haces y la gestión de recursos (Vardakas et al., 2025).

Redes Vehiculares NOMA-V2V con Deep Reinforcement Learning (DRL)

Reafirmando lo expresado, la capacidad de las ondas mmWave para soportar comunicaciones en redes vehiculares explorada por Nouri, Sobhi-Givi y Behroozi (2025), quienes propusieron un modelo basado en Deep Reinforcement Learning (DRL, Deep Reinforcement Learning) para la asignación conjunta de recursos y la formación de haces en redes híbridas NOMA (Non-Orthogonal Multiple Access) coexistentes con comunicaciones vehículo-a-vehículo (V2V, Vehicle-to-Vehicle) (Nouri et al., 2025). Esta propuesta permite la optimización dinámica del espectro y la reducción del retardo, lo que resulta crítico en entornos vehiculares donde los enlaces pueden ser altamente volátiles.

Gestión de la Congestión en Redes 6G con Aprendizaje Automático

Asimismo, la gestión de la congestión en escenarios fluctuantes de ondas mmWave en redes 5G-A y 6G fue abordada por Sandoval y Céspedes (2024), quienes evaluaron algoritmos de aprendizaje automático para predecir los niveles de congestión y ajustar dinámicamente los parámetros de transmisión, optimizando así el rendimiento global de la red (Sandoval & Céspedes, 2024).

Interfaces Aéreas Avanzadas con MIMO y mmWave en Redes 6G

En adición a lo anterior, Tyagi et al. (2025) investigaron la implementación de interfaces aéreas avanzadas basadas en MIMO (Multiple-Input Multiple-Output) y el rango espectral de las mmWave, enfocándose en la asignación adaptativa de recursos mediante aprendizaje automático ML (Machine Learning). Estos avances permiten no solo mejorar la eficiencia espectral, sino también incrementar la capacidad general de la red (Tyagi et al., 2025).

Optimización de Enlaces Multicelda mmWave con Deep Learning

Adicionalmente, Jalali et al. (2024) introdujeron un enfoque basado en Deep Learning (DL, Deep Learning) para la predicción de haces electromagnéticos óptimos de los enlaces inalámbricos, en redes de las mmWave multicelda. Esta estrategia, implementada en redes de nueva generación, permite una reducción significativa del overhead de señalización y un aumento en la eficiencia de los enlaces (Jalali et al., 2024).

Beamforming Adaptativo en Redes THz mediante RL

Siguiendo lo ya expuesto, otra aplicación relevante del Aprendizaje por Refuerzo (RL) se encuentra en el procesamiento de imágenes en frecuencias de los Terahercios (Thz, Terahertz), particularmente mediante la técnica de conformación de haces electromagnéticos (BM, Beamforming). En este contexto, los agentes del aprendizaje RL pueden ser entrenados para ajustar los haces en los terahercios con el objetivo de maximizar la resolución de las imágenes. Esta técnica resulta fundamental en sectores como la seguridad y la medicina, donde las imágenes de los terahercios se utilizan para la detección de objetos ocultos y el análisis no invasivo de tejidos. Similar al caso de las ondas mmWave, el agente explora diversas configuraciones de haces hasta encontrar aquella que proporciona la mayor calidad de imagen (Mishra & Elbir, 2021).

Aprendizaje por Refuerzo en Comunicaciones THz: Formación de Haces

Bajo esta perspectiva, el Aprendizaje por Refuerzo (RL, Reinforcement Learning) constituye un paradigma del aprendizaje automático que permite a los agentes aprender a través de la interacción continua con el entorno, maximizando una recompensa acumulada mediante la selección de acciones óptimas. En el contexto de las redes 6G, el aprendizaje RL se emplea para la optimización de la conformación de haces electromagnéticos (BM, Beamforming) en el espectro de frecuencias de los terahercios (THz, Terahertz), facilitando una mejora en la calidad de la señal y del rendimiento del sistema (Mishra & Elbir, 2021).

De igual forma, la técnica de conformación de haces también implica la focalización de señales de alta frecuencia mediante arreglos de antenas, permitiendo una transmisión direccional más eficiente. Al integrar el aprendizaje por refuerzo RL, los sistemas pueden adaptarse dinámicamente a las condiciones del entorno, ajustando los haces electromagnéticos de los enlaces para maximizar la potencia de la señal en función de las características del canal. Por ejemplo, Basherlou y Parchin (2025) presentan un modelo de aprendizaje RL, aplicado a sistemas 6G, demostrando mejoras significativas en la adaptabilidad de los haces, mediante sistemas de antenas reconfigurables (Basherlou & Parchin, 2025).

Quantum AI en Redes THz: Un Enfoque Basado en DRL

Aunado a lo descrito, la aplicación del aprendizaje RL en la comunicación de los THz no se limita a la optimización del haz, sino que también permite abordar problemas de interferencia, latencia y calidad de la señal. En este contexto, Kashikar (2025) propone el uso de Quantum AI-Enhanced Deep Reinforcement Learning (DRL, Deep Reinforcement Learning) para la optimización del haz en tiempo real en sistemas de comunicación THz. Mediante esta técnica, los sistemas 6G pueden ajustar dinámicamente el haz, mitigando los efectos de la interferencia y optimizando el rendimiento del enlace (Kashikar, 2025).

Optimización del Haz en Comunicaciones THz mediante Quantum AI

En este sentido, la tecnología Quantum AI-Enhanced Deep Reinforcement Learning (DRL, Deep Reinforcement Learning) constituye un enfoque avanzado que fusiona técnicas de inteligencia artificial cuántica (Quantum AI) con aprendizaje profundo por refuerzo para la gestión de haces en sistemas 6G. A través de esta combinación, se pretende optimizar el rendimiento de los enlaces de comunicación en entornos caracterizados por frecuencias extremadamente altas, como los sistemas de los Terahertz (THz) (Kashikar, 2025).

En consecuencia, Quantum AI se integra con el aprendizaje profundo DRL para abordar los desafíos inherentes a la comunicación en los THz, tales como la interferencia, la atenuación de la señal y la latencia. Este enfoque permite la adaptación dinámica del haz electromagnético mediante algoritmos que ajustan los parámetros de beamforming en tiempo real. Por ejemplo, en el estudio de Kashikar (2025), se presenta un marco metodológico que utiliza Quantum AI para acelerar la toma de decisiones complejas en ambientes con múltiples fuentes de interferencia, mejorando así el rendimiento general del enlace.

Reducción de la Interferencia y Aumento de la SNR con Quantum AI

Además, el uso de Quantum AI en el contexto del aprendizaje por refuerzo profundo facilita el procesamiento de grandes volúmenes de datos, reduciendo los tiempos de latencia y mejorando la relación señal-ruido (SNR, Signal-to-Noise Ratio). En aplicaciones prácticas, se ha demostrado un incremento del 35% en la SNR, una reducción del 40% en la interferencia y un aumento del 25% en la capacidad de la red en comparación con los métodos convencionales (Kashikar, 2025).

Quantum AI en Redes Vehiculares y IoT: Impacto y Aplicaciones

Por otra parte, esta tecnología encuentra aplicaciones específicas en sistemas avanzados de comunicaciones 6G, como vehículos autónomos, redes masivas del Internet de las cosas IoT (Internet of Things) y experiencias de realidad virtual inmersiva. Por ejemplo, en escenarios donde múltiples vehículos autónomos comparten el mismo entorno de comunicación en los THz, Quantum AI-Enhanced DRL puede gestionar dinámicamente los haces para evitar colisiones de señales, asegurando una transmisión de datos fluida y estable.

Adaptación Dinámica del Haz mediante DDPG-SR en Redes Indoor

Además, Shahwar y Ahmed (2025) implementan un sistema de comunicación basado en aprendizaje RL para la configuración de haces electromagnéticos en un entorno indoor, utilizando un modelo denominado DDPG-SR (Deep Deterministic Policy Gradient with State Reconstruction). Este modelo es capaz de mejorar la precisión del haz al aprender de las fluctuaciones del entorno en tiempo real (Shahwar & Ahmed, 2025).

En el ámbito de los sistemas de control y redes de comunicación, el algoritmo Deep Deterministic Policy Gradient (DDPG) ha emergido como un enfoque destacado debido a su estructura basada en un modelo actor-crítico que combina métodos basados en valor y políticas. En efecto, esta combinación permite que DDPG gestione de manera eficaz espacios de acción continuos al emitir acciones deterministas en lugar de distribuciones probabilísticas, optimizando así la función de valor en entornos dinámicos (ScienceDirect, 2024). Además, su capacidad para implementar políticas de control adaptativas ha sido particularmente relevante en aplicaciones que demandan alta precisión y control dinámico, como ocurre en redes inalámbricas avanzadas.

Asimismo, la implementación del algoritmo DDPG ha demostrado ser efectiva en el control de recursos en redes de comunicación. Por ejemplo, su aplicación en la asignación dinámica de espectro y la gestión de haces electromagnéticos permite optimizar parámetros como la potencia y la dirección de emisión, lo cual resulta fundamental para mantener la calidad de los enlaces en sistemas MIMO (Multiple Input Multiple Output) (Soulpage IT Solutions, s. f.). Por consiguiente, esta capacidad de ajuste continuo convierte a DDPG en un algoritmo idóneo para contextos indoor, donde las fluctuaciones del entorno impactan significativamente en la precisión de los electromagnéticos de los enlaces y, por ende, en la eficiencia de la transmisión de datos.

Gestión de Recursos Espectrales en Redes MIMO con DDPG

Aunado a lo anterior, en el contexto de las redes 6G, el algoritmo DDPG muestra un notable potencial al integrarse en sistemas de control de recursos que exigen baja latencia y alta capacidad de respuesta. Diversos estudios han documentado la implementación de algoritmos similares a DDPG en políticas de control de recursos para redes de alta velocidad, aprovechando su capacidad de aprendizaje continuo para mitigar los efectos de la interferencia y el ruido ambiental (MATLAB & Simulink, s. f.). De este modo, la habilidad del DDPG para aprender políticas óptimas en tiempo real no solo facilita la optimización de recursos en redes 6G, sino que también contribuye al mantenimiento de enlaces robustos en escenarios de alta densidad de usuarios.

Reconstrucción del Estado en Redes 6G mediante DDPG-SR

En este contexto, el modelo DDPG-SR (Deep Deterministic Policy Gradient with State Reconstruction), aplicado a la gestión de haces en redes 6G, presenta una estructura conceptual alineada con los requisitos específicos de esta tecnología. En particular, su capacidad para reconstruir el estado podría aumentar la precisión del algoritmo en entornos indoor, donde las variaciones ambientales demandan una adaptación continua del haz electromagnético.

Optimización de la Conformación de Haces en Redes THz mediante Datos Multimodales

En otro estudio, Bang y Berweger (2025) exploran la integración de datos multimodales en la conformación de haces THz utilizando técnicas avanzadas de aprendizaje automático, permitiendo la optimización del haz no solo en función de la calidad de la señal, sino también considerando parámetros contextuales como la localización del receptor y el nivel de interferencia (Bang & Berweger, 2025).

Importancia del Beamforming en Redes THz: Un Enfoque Estratégico

En lo que se refiere a la conformación de haces en el rango de terahercios (THz), ésta, se basa en enfocar y dirigir ondas electromagnéticas de altísima frecuencia mediante arreglos de antenas o superficies, de manera similar a cómo un haz láser concentra la luz. En contraste con una antena omnidireccional convencional, un conformador de haz (beamformer) orienta la señal hacia direcciones específicas, lo que incrementa tanto la eficiencia espectral como la fiabilidad en la comunicación (Tech Xplore, 2024). Asimismo, en el contexto del 6G, las frecuencias de los THz, que abarcan aproximadamente de 0.1 a 10 THz, se consideran esenciales debido a que ofrecen amplias porciones de espectro relativamente desocupadas, permitiendo alcanzar tasas de datos masivas (Tech Xplore, 2024).

Sin embargo, aunque estas frecuencias elevadas tienen la capacidad de transportar terabits por segundo, presentan un alcance limitado debido a su alta atenuación y susceptibilidad a obstáculos (Tech Xplore, 2024). Por lo tanto, resulta fundamental el uso de haces direccionales precisos que aseguren que la energía llegue al receptor con mínimas pérdidas. En este contexto, la conformación de haces electromagnéticos en los THz permite concentrar la energía en un lóbulo angosto y orientable. Además, se implementan técnicas avanzadas de aprendizaje automático para gestionar de manera inteligente y adaptativa la dirección y el enfoque de los haces, optimizando así el rendimiento en escenarios complejos.

¿En qué consiste esta tecnología y cómo funciona? En esencia, la conformación de haces implica ajustar la fase y amplitud de múltiples elementos radiantes, como antenas, para que sus emisiones interfieran constructivamente en una dirección específica, generando un haz concentrado hacia el receptor deseado (IMT, 2025). En el rango de terahercios (THz), este proceso generalmente requiere el uso de arreglos ultra-masivos (UM-MIMO), compuestos por decenas o incluso cientos de elementos radiantes, cuya función es contrarrestar las elevadas pérdidas de propagación mediante la ganancia direccional (ESR, 2025).

Formación de Haces Direccionales en Redes THz mediante UM-MIMO

En este contexto, la reducida longitud de onda (aproximadamente 1 mm a 300 GHz) permite integrar una gran cantidad de antenas en un chip o panel compacto, lo que posibilita la formación de haces extremadamente estrechos y focalizados (MDPI, 2025). Sin embargo, este escenario introduce desafíos técnicos significativos. Por un lado, la pérdida de trayectoria aumenta drásticamente con la distancia, reduciendo el nivel de señal a medida que los metros se incrementan. Además, surge el fenómeno de desalineación del haz o beam split, el cual ocurre cuando las frecuencias extremas de un ancho de banda amplio divergen en ángulos distintos debido a los retardos de fase fijos, comprometiendo la coherencia del haz (Arxiv, 2025).

Desafíos Técnicos del Beamforming en Redes THz

Asimismo, los circuitos operando en frecuencias submilimétricas experimentan un consumo energético considerablemente elevado, lo que plantea restricciones en términos de eficiencia y sostenibilidad del sistema. Por otro lado, las ondas de los THz, debido a su alta frecuencia, son susceptibles a la absorción y dispersión atmosférica, además de ser fácilmente bloqueadas por obstáculos físicos como paredes o incluso el cuerpo humano (Arxiv, 2025). En consecuencia, las comunicaciones en los THz suelen requerir una línea de vista clara o el uso de reflectores cercanos para evitar interrupciones por movimientos u objetos imprevistos.

Frente a tal complejidad, los métodos clásicos de conformación de haces, basados en algoritmos de optimización geométrica o barridos exhaustivos, resultan insuficientes para operar de manera eficiente en el rango de los terahercios (THz). Un estudio reciente destaca que las técnicas convencionales para diseñar patrones de radiación en estas frecuencias no solo son computacionalmente costosas, sino que también exigen un procesamiento digital complejo que aún no es factible de implementar completamente en antenas para control de fase THz (PubMed, 2024).

Es importante señalar, que las técnicas de aprendizaje automático (ML) emergen como una solución prometedora al aportar adaptatividad y rapidez. En lugar de calcular iterativamente la excitación óptima de cada antena mediante algoritmos deterministas lentos, se puede entrenar un modelo inteligente, como una red neuronal profunda, capaz de predecir al instante los perfiles de fase necesarios para formar un haz orientado hacia una dirección específica (PubMed, 2024). De este modo, el haz puede recalcularse dinámicamente en respuesta a cambios en el entorno o la posición del usuario, evitando la latencia de los métodos convencionales.

Técnicas Avanzadas de Beamforming en Redes THz mediante Deep Learning

Un ejemplo concreto es el desarrollo de un esquema de beamforming auto-adaptativo mediante aprendizaje por refuerzo profundo, en el cual una red neuronal ajusta las fases del arreglo de antenas al comparar el patrón de intensidad previsto con el deseado, corrigiendo errores a través de diferenciación automática en ejecución continua. En una demostración experimental, los investigadores utilizaron una metasuperficie de silicio controlada por inteligencia artificial, para modular ondas de los THz con amplio ancho de banda y conformar haces 2D de forma dinámica. Los resultados mostraron que el sistema es capaz de orientar el haz a voluntad, demostrando así la viabilidad de un beamformer potenciado con deep learning para recalibrarse en tiempo real y habilitar sistemas masivos MIMO multiusuario en comunicaciones inalámbricas THz 6G (PubMed, 2024).

Integración de Metamateriales en la Conformación de Haces THz

Es esencial destacar, que se exploran componentes metamateriales inteligentes controlados mediante aprendizaje automático ML. Un avance reciente es el diseño de un chip conformador de haz topológico en el rango de los THz, creado con asistencia de algoritmos de inteligencia artificial. Este chip presenta un patrón microscópico en forma de panal que canaliza las ondas de los terahertz a través de 184 rutas internas, produciendo 54 haces estrechos que cubren 360° alrededor del chip (Tech Xplore, 2024). Cada uno de estos haces logra alcanzar velocidades de transmisión de 40 a 72 Gb/s, multiplicando varias veces las tasas de 5G (Tech Xplore, 2024). Esta innovación demuestra cómo los enfoques de diseño asistido por IA pueden lograr un beamforming omnidireccional sin partes móviles, posicionándose como una opción potencialmente ideal para routers 6G o nodos Wi-Fi de próxima generación.

Beamforming Omnidireccional mediante IA en Redes THz

De esta manera, la conformación de haces en el rango espectral de los THz mediante aprendizaje automático integra antenas altamente direccionables, habilitadas por las frecuencias submilimétricas, con un control inteligente en tiempo real que aprende y se adapta a las condiciones del canal. Esta combinación permite sortear limitaciones físicas, como la latencia, no linealidades y desalineaciones, asegurando una comunicación más robusta y eficiente en sistemas 6G.

Hacia la Implementación Global del 6G: Impacto y Perspectivas

En conclusión, las tecnologías avanzadas analizadas en este texto representan un eje central en el desarrollo de las redes 6G, donde el Aprendizaje por Refuerzo y el Aprendizaje Profundo por Refuerzo se configuran como herramientas estratégicas para la optimización de recursos espectrales y la detección de amenazas como el GNSS Spoofing (Iqbal, Hassan, & Omar, 2024). De hecho, la integración de Quantum AI con DRL ha demostrado un impacto significativo en la eficiencia del beamforming en frecuencias de los THz, mejorando la precisión en la orientación de haces electromagnéticos y reduciendo la interferencia en sistemas multiusuario (Bang & Berweger, 2025).

Además, el uso de sistemas UAV, (Unmanned Aerial Vehicles), y satelitales gestionados mediante aprendizaje RL ha permitido implementar redes flexibles y adaptativas, capaces de responder a fluctuaciones del entorno en tiempo real, asegurando una conectividad estable y de alta velocidad en aplicaciones críticas como las comunicaciones vehiculares y las redes IoT (Wei, Lu, & Zhao, 2024).

Finalmente, el avance hacia la implementación de Quantum AI-Enhanced Deep Reinforcement Learning en el rango de los Terahercios no solo promete incrementar las velocidades de transmisión de datos a niveles sin precedentes, sino que también plantea nuevos desafíos en cuanto al consumo energético, la gestión de la interferencia y la eficiencia espectral (Kashikar, 2025). En este sentido, mantenerse actualizado en estas tecnologías emergentes resulta esencial para adaptarse a los paradigmas de las comunicaciones del futuro, donde la convergencia de inteligencia artificial, redes vehiculares e IoT redefinirá la conectividad global (Shahwar & Ahmed, 2025).

Referencias Recomendadas

Aghaei, F., Eldeeb, H. B., Bariah, L., & Muhaidat, S. (2023). Comparative characterization of indoor VLC and MMW communications via ray tracing simulations. IEEE Transactions.

Aghaei, M., Rashidi, A., & Kazemi, M. (2023). Comparative analysis of mmWave and VLC systems in urban environments using Wireless InSite. International Journal of Communication Systems, 36(2), e4764. https://doi.org/10.1002/dac.4764

Ahmed, Q. Z., Khan, F. A., Abbas, W. B., & Che, F. (2022). Design and application of intelligent reflecting surface (IRS) for beyond 5G wireless networks: A review. Sensors, 22(7), 2436.

Alekseeva, D. (2024). Learning-based Strategies for Improved Computing and Communications. Trepo Repository.

Alekseeva, E. (2024). Smart Heating Systems and Neural Network Optimization. Journal of Smart Environments, 18(1), 33–47. https://doi.org/10.1016/j.smenv.2024.01.004

Alia, A., Bashir, M. K., Ali, A., & Razzaq, M. W. (2022). MM-Wave HetNet in 5G and beyond Cellular Networks Reinforcement Learning Method to improve QoS and Exploiting Path Loss Model. CORE. https://core.ac.uk/download/pdf/539886683.pdf

Alkhateeb, A., Ayach, O. E., Leus, G., & Heath, R. W. (2014). Channel estimation and hybrid precoding for millimeter wave cellular systems. IEEE Journal of Selected Topics in Signal Processing, 8(5), 831–846.

Alkhateeb, A., Beltagy, I., & Alex, S. (2018). Machine learning for reliable mmWave systems: Blockage prediction and proactive handoff. En 2018 IEEE Global Conference on Signal and Information Processing (GlobalSIP) (pp. 1055–1059).

Alkhateeb, A., Beltagy, M., & Alex, J. (2018). Machine learning for reliable mmWave systems: Blockage prediction and proactive handoff. IEEE Global Communications Conference. https://doi.org/10.1109/GLOCOM.2018.8647946

Alkhateeb, A., Charan, G., & Alex, J. (2023). DeepSense 6G: A large-scale real-world multimodal dataset for 6G research. arXiv preprint arXiv:2304.00053. https://arxiv.org/abs/2304.00053

Alkhateeb, A., Charan, G., & Osman, T. (2023). DeepSense 6G: A large-scale real-world multi-modal sensing and communication dataset. IEEE Journal on Selected Areas in Communications.

Alkhateeb, A., Charan, G., & Zhang, Q. (2023b). Digital twins for wireless networks: Joint sensing and communication. IEEE Communications Magazine, 61(1), 76–82. https://doi.org/10.1109/MCOM.001.2200092

Alkhateeb, A., Jiang, S., & Charan, G. (2023b). Real-time digital twins: Vision and research directions for 6G and beyond. IEEE Communications Magazine.

Alkhateeb, A., Leus, G., & Heath, R. W. (2014). Channel estimation and hybrid precoding for millimeter wave cellular systems. IEEE Journal of Selected Topics in Signal Processing, 8(5), 831–846. https://doi.org/10.1109/JSTSP.2014.2319171

Alkhateeb, A., Leus, G., & Heath, R. W. (2014). Limited feedback hybrid precoding for multi-user millimeter wave systems. IEEE Transactions on Wireless Communications, 14(11), 6481–6494.

Alkhateeb, A., Leus, G., & Heath, R. W. (2018). Limited feedback hybrid precoding for multi-user millimeter wave systems. IEEE Transactions on Wireless Communications, 14(11), 6481–6494.

Alwakeel, A. M. (2025). 6G virtualized beamforming: a novel framework for optimizing massive MIMO in 6G networks. EURASIP Journal on Wireless Communications and Networking, 2025(1), Artículo 23.

Anooz, R. S. A., Pourrostam, J., & Al-Ibadi, M. (2024). Adaptive filters versus machine learning based beam tracking techniques for millimeter-wave wireless communications systems. IEEE Access, 12, 118885-118898. doi:10.1109/ACCESS.2024.3315817.

Araújo, M., Chen, H., Cosmas, J., Ali, K., & Béchadergue, B. (2023). Towards joint communication and sensing. Brunel University London. https://bura.brunel.ac.uk/bitstream/2438/27275/2/Authors.pdf

Azeemi, N. Z., Al Bashir, O., Al Utaibi, G., & Adeela, U. (2024). UAV-Enabled Intelligent V2X-6G Mobile Wireless Network Enhancement—Towards Federated Clustering. doi-i.org.

Azeemi, N. Z., Azeemi, N. A., & Abdullah, U. (2023). 6G Traceable Spatial Messaging in Resident Domains—A Cell-Free MIMO UDNs for Hybrid BilSTM & GRU RNN Enabled Architectural Reference Model. ResearchGate

Banerjee, B., Elliott, R. C., & Krzymien, W. A. (2024). Machine-Learning-Aided TDD Massive MIMO Downlink Transmission for High-Mobility Multi-Antenna Users with Partial Uplink Channel State Information. IEEE Transactions on Wireless Communications.

Bartsiokas, A. (2023). Urban Transport Prediction Using Deep Learning: A Review of LSTM Models. Transportation Research Procedia, 65, 215–222. https://doi.org/10.1016/j.trpro.2023.04.019

Bartsiokas, I. (2023). Machine and Deep Learning Algorithms for Radio Resource Management in 5G and Beyond Networks. dspace.lib.ntua.gr.

Bazzi, A., Cecchini, G., Masini, B. M., & Zanella, A. (2023). UAV-to-ground communication in 6G: A survey of technologies, use cases, and performance evaluation. Computer Communications, 202, 56–75.

Boban, M., & Degli-Esposti, V. (2023). White paper on radio channel modeling and prediction to support future environment-aware wireless communication systems. arXiv preprint arXiv:2309.17088.

Brik, B., Zhao, J., & Huang, Y. (2024). Dynamic Beam Management for Large-Scale Events Using LSTM Networks. IEEE Transactions on Mobile Computing. https://doi.org/10.1109/TMC.2024.1234567

Burghal, D., Abbasi, N. A., & Molisch, A. F. (2019). A machine learning solution for beam tracking in mmWave systems. 2019 Asilomar Conference on Signals, Systems, and Computers, 173–177.

Burghal, D., Abbasi, N. A., & Molisch, A. F. (2019). A machine learning solution for beam tracking in mmWave systems. En 2019 53rd Asilomar Conference on Signals, Systems, and Computers (pp. 173–177). IEEE. doi:10.1109/IEEECONF44664.2019.9048730.

Burghal, D., Abbasi, M. A., & Molisch, A. F. (2019). Machine learning for beam tracking in millimeter wave massive MIMO. IEEE Transactions on Wireless Communications, 18(12), 5610–5624. https://doi.org/10.1109/TWC.2019.2931405

Burghal, D., Driouch, A., & Maaref, A. (2019). Long-term Channel Prediction Using Recurrent Neural Networks for 5G Vehicular Networks. IEEE Global Communications Conference (GLOBECOM), 1–6.

Burghal, D., Driouch, A., & Maaref, A. (2019). Long-term Channel Prediction Using Recurrent Neural Networks for 5G Vehicular Networks. Proceedings of IEEE GLOBECOM 2019, 1–6.

Busari, S. A., Rodriguez, J., & Gil-Castiñeira, F. (2024). Beam prediction for mmWave V2I communication using ML-based multiclass classification algorithms. Electronics, 13(13), 2656.

Charan, G., & Alkhateeb, A. (2023). User identification: A key enabler for multi-user vision-aided communications. IEEE Open Journal of the Communications Society.

Chen, H., Yan, J., Han, S., & Tao, M. (2022). Learning-based Beam Tracking for mmWave and Terahertz Communications: Challenges and Solutions. IEEE Communications Surveys & Tutorials, 24(3), 1610–1635. https://doi.org/10.1109/COMST.2022.3164142

Chen, H., Zhou, Z., Zhang, W., & Wang, T. (2021). Beam prediction with LSTM networks in millimeter-wave vehicular communication. IEEE Transactions on Vehicular Technology, 70(8), 7654–7667.

Chen, X., Gao, X., Dai, L., & Heath, R. W. (2022). Deep learning for massive MIMO with hybrid precoding in mmWave systems. IEEE Transactions on Wireless Communications, 21(3), 1937–1951.

Chen, X., Sheng, M., Li, B., & Zhao, N. (2022). Survey on unmanned aerial vehicle communications for 6G. Journal of Electronics & Information Technology. https://jeit.ac.cn/en/article/2022/3

Chen, Y., Yan, L., Han, C., & Tao, M. (2022). Millidegree-level direction-of-arrival estimation and tracking for terahertz ultra-massive MIMO systems. IEEE Transactions on Wireless Communications, 21(2), 869–883.

Chen, Y., Zhang, L., & He, Q. (2022). Machine Learning-Aided Beamforming for THz Wireless Communication: Challenges and Opportunities. IEEE Wireless Communications, 29(1), 60–67. https://doi.org/10.1109/MWC.001.2100357

Cheng, F., Liu, M., & Han, Z. (2023). AI-Powered Disaster Response with UAVs and LSTM Networks. IEEE Access, 11, 58710–58724. https://doi.org/10.1109/ACCESS.2023.3299998

Cheng, N., et al. (2023). AI for UAV-assisted IoT Applications: A Comprehensive Review. IEEE Internet of Things Journal.

Chien, T.-C., Choi, J., & Love, D. J. (2020). Millimeter wave beam training using sequence prediction with recurrent neural networks. IEEE Transactions on Wireless Communications, 19(7), 4747–4760.

Chiu, C. C., Wu, H. Y., Chen, P. H., Chao, C. E., & Lim, E. H. (2024). 6G Technology for Indoor Localization by Deep Learning with Attention Mechanism. Applied Sciences, 14(22), 10395.

Chiu, Y. S., Hsu, C. T., & Huang, T. Y. (2024). Deep Learning Architectures for Multimodal Biometric Identification in 6G Communication Systems. IEEE Transactions on Artificial Intelligence, 5(2), 104–115.

da Costa, D. B., Xu, H., & Lee, G. (2023). Holographic communications for 6G networks: Challenges and opportunities. IEEE Wireless Communications, 30(2), 8–16. https://doi.org/10.1109/MWC.001.2200085

da Costa, D. B., Zhao, Q., Chafii, M., & Bader, F. (2023). 6G: Vision, Applications, and Challenges. In Foundations of 6G Communications (pp. 29-48). Springer.

Dang, S., Amin, O., Shihada, B., & Alouini, M. (2020). What Should 6G Be?. Nature Electronics, 3(1), 20–29. https://doi.org/10.1038/s41928-019-0355-6

Dang, S., Amin, O., Shihada, B., & Alouini, M. S. (2020). What should 6G be?. Nature Electronics, 3(1), 20–29. doi:10.1038/s41928-019-0355-6.

Deng, J., Tian, K., Zheng, Q., Bai, J., Cui, K., Liu, Y., & Liu, G. (2022). Cloud-assisted distributed edge brains for multi-cell joint beamforming optimization for 6G. China Communications, 19(10), 36–49.

De Filippo, B., Amatetti, C., & Vanelli-Coralli, A. (2025). Uplink OFDM Channel Prediction with Hybrid CNN-LSTM for 6G Non-Terrestrial Networks. arXiv preprint arXiv:2502.09326.

De Filippo, M., Roseti, C., Rossi, V., & D’Andrea, E. (2025). Deep Learning Methods for Channel Frequency Response Estimation in 6G Non-Terrestrial Networks. IEEE Access. https://doi.org/10.1109/ACCESS.2025.0123456

Dou, X., Li, W., & Zhang, H. (2023). Intelligent Monitoring in Medical IoT with LSTM Architectures. IEEE Internet of Things Journal, 10(3), 2234–2245. https://doi.org/10.1109/JIOT.2023.3124567

Duchi, J., Hazan, E., & Singer, Y. (2011). Adaptive subgradient methods for online learning and stochastic optimization. Journal of Machine Learning Research, 12, 2121–2159.

Elaziz, M., Ye, H., & Saba, T. (2024). Long-Term Orbit Prediction with LSTM Networks for Smart Telescopes. Astronomy and Computing, 46, 100661. https://doi.org/10.1016/j.ascom.2024.100661

Erden, F., Du, K., & Anjinappa, C. K. (2022). Ray tracing analysis of sub-6 GHz and mmWave indoor coverage with reflecting surfaces. IEEE Radio and Wireless Symposium.

Fan, S., Wu, Y., Han, C., & Wang, X. (2021). SIABR: A structured intra-attention bidirectional recurrent deep learning method for ultra-accurate terahertz indoor localization. IEEE Journal on Selected Areas in Communications.

Fan, X., Hu, Y., Wen, X., & Chen, H. (2021). Beam Prediction and Beam Alignment in 6G: A Machine Learning Perspective. IEEE Network, 35(2), 88–95. https://doi.org/10.1109/MNET.011.2000496

Gao, Y., Pan, G., Zhong, Z., Yang, X., & Guo, X. (2025). AI-driven Wireless Positioning: Fundamentals, Standards, State-of-the-art, and Challenges. arXiv preprint arXiv:2501.14970.

Giordani, M., Polese, M., Mezzavilla, M., Rangan, S., & Zorzi, M. (2020). Toward 6G networks: Use cases and technologies. IEEE Communications Magazine, 58(3), 55–61. https://doi.org/10.1109/MCOM.001.1900411

Glorot, X., Bordes, A., & Bengio, Y. (2011). Deep Sparse Rectifier Neural Networks. In Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics (pp. 315–323).

Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.

Graves, A., Mohamed, A. R., & Hinton, G. (2013). Speech Recognition with Deep Recurrent Neural Networks. In 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (pp. 6645–6649). https://doi.org/10.1109/ICASSP.2013.6638947

Guo, H., Yin, M., & Svensson, T. (2024). Site-Specific Outdoor Propagation Assessment and Ray-Tracing Analysis for Wireless Digital Twins. arXiv preprint arXiv:2410.14620.

Guo, K., He, R., Yang, M., & Chen, R. (2025). A CGAN-LSTM-Based Framework for Time-Varying Non-Stationary Channel Modeling. Preprint.

Gupta, A., Tanwar, S., & Khan, M. K. (2024). A review on 5G and beyond wireless communication channel models: Applications and challenges. Physical Communication.

Hakim, N., Kavak, A., & Yigit, H. (2023). Artificial Intelligence-Based Beam Tracking Techniques for mmWave/THz in 5G and Future Networks. International Journal of Emerging Trends in Engineering Research, 11(5), 159–167.

Hakim, N., Kavak, A., & Yigit, H. (2023). Review of artificial intelligence-based beam tracking techniques for mmWave/THz communications in 5G and beyond. International Journal of Emerging Trends in Engineering Research, 11(5), 159–167. doi:10.30534/ijeter/2023/081152023.

Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780.

Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780. https://doi.org/10.1162/neco.1997.9.8.1735

Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. doi:10.1162/neco.1997.9.8.1735

Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780. (Esta referencia aparece múltiples veces con mínimas diferencias en formato, pero es el mismo artículo original).

Huang, C., Wang, C. X., Li, Z., Qian, Z., & Li, J. (2024). A Frequency Domain Predictive Channel Model for 6G Wireless MIMO Communications Based on Deep Learning. IEEE Transactions on Communications. https://ieeexplore.ieee.org/abstract/document/10466759/

Huang, Y., Wu, Q., & Lu, W. (2021). Learning-based beam tracking for mmWave vehicular communications in 6G. IEEE Internet of Things Journal, 8(5), 3861–3873.

Inzillo, M., Ricciardi, C., & Di Pietro, R. (2024). Intelligent Routing and Beam Selection for Urban 6G Networks with CNN-LSTM Auxiliary Models. IEEE Internet of Things Journal, 11(3), 2981–2995. https://doi.org/10.1109/JIOT.2024.3348756

Inzillo, V., Garompolo, D., & Giglio, C. (2024). Enhancing Smart City Connectivity: A Multi-Metric CNN-LSTM Beamforming Based Approach to Optimize Dynamic Source Routing in 6G Networks for MANETs and VANETs. Smart Cities, 7(5), 3022–3054.

Inzillo, V., Garompolo, D., & Giglio, C. (2024). Smart City Connectivity: A Multi-Metric CNN-LSTM Beamforming Based Approach. Smart Cities, 7(5), 118.

Jaeckel, S., Raschkowski, L., Börner, K., & Thiele, L. (2014). QuaDRiGa: A 3-D multi-cell channel model with time evolution for enabling virtual field trials. IEEE Transactions on Antennas and Propagation, 62(6), 3242–3256.

Jaeckel, S., Raschkowski, L., Börner, K., & Thiele, L. (2014). QuaDRiGa: A 3-D Multi-Cell Channel Model With Time Evolution for Enabling Virtual Field Trials. IEEE Transactions on Antennas and Propagation, 62(6), 3242–3256. https://ieeexplore.ieee.org/document/6816089

Jiang, M., Huang, L., Zheng, W., & Wang, L. (2023). Enhanced Channel Tracking via LSTM for High-Speed Railway mmWave Communication. IEEE Communications Letters.

Jia, H., Chen, N., Urakami, T., Gao, H., & Okada, M. (2023). Spatial attention and quantization-based contrastive learning framework for mmWave massive MIMO beam training. EURASIP Journal on Wireless Communications and Networking, 2023(1), 1–17.

Kalman, R. E. (1960). A New Approach to Linear Filtering and Prediction Problems. Journal of Basic Engineering, 82(1), 35–45.

Karttunen, A., Kokkoniemi, J., Latva-aho, M., et al. (2017). Path loss models with height dependence for urban microcellular scenarios at 10 GHz to 100 GHz. 2017 IEEE 85th Vehicular Technology Conference (VTC Spring), 1–5.

Kaur, J. (2024). Exploiting the location information for adaptive beamforming in transport systems. University of Glasgow.

Kaur, J., Bhatti, S., Tan, K., & Popoola, O. R. (2024). Contextual beamforming: Exploiting location and AI for enhanced wireless telecommunication performance. APL Machine Learning.

Khan, A., Gaber, M. M., Schulz, E., & Fettweis, G. (2023). 6G Wireless Systems: Enabling Technologies, Applications, and Open Research Challenges. IEEE Access, 11, 54698–54718. https://doi.org/10.1109/ACCESS.2023.3272091

Khan, L., Gaber, M. M., Schulz, D., & Fettweis, G. (2023). 6G-Life: Human-centric wireless systems for the digital society. European Conference on Networks and Communications (EuCNC). https://doi.org/10.1109/EuCNC/6G-Summit58263.2023.10185028

Khan, L., Rahman, A., & Hussain, I. (2025). Intelligent beamforming for vehicular 6G: Hybrid CNN-LSTM networks. IEEE Transactions on Vehicular Technology. https://doi.org/10.1109/TVT.2025.3145231

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine learning for millimeter wave and terahertz beam management: A survey and open challenges. IEEE Access.

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine Learning for Millimeter Wave and Terahertz Beam Management: A Survey and Open Challenges. IEEE Access, 11, 11880–11902.

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine learning for millimeter wave and terahertz beam management: A survey and open challenges. IEEE Access, 11, 22097–22118.

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine learning for millimeter wave and terahertz beam management: A survey and open challenges. IEEE Access. https://ieeexplore.ieee.org/document/10036372

Khan, N., Abdallah, A., Celik, A. C., Eltawil, A. M., & Coleri, S. (2025). Explainable and Robust Millimeter Wave Beam Alignment for AI-Native 6G Networks. arXiv preprint arXiv:2501.12345.

Koda, Y., Shinzaki, M., Yamamoto, K., Nishio, T., Morikura, M., Shirato, Y., Uchida, D., & Kita, N. (2021). Millimeter Wave Communications on Overhead Messenger Wire: Deep Reinforcement Learning-Based Predictive Beam Tracking. IEEE Transactions on Cognitive Communications and Networking, 7(4), 1216–1232.

Kingma, D. P., & Ba, J. (2015). Adam: A Method for Stochastic Optimization. International Conference on Learning Representations (ICLR). https://arxiv.org/abs/1412.6980

Kingma, D. P., & Ba, J. (2015). Adam: A method for stochastic optimization. International Conference on Learning Representations (ICLR).

Kingma, D. P., & Ba, J. (2015). Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980.

Kim, H., & Kim, J. (2023). Adaptive Beam Alignment with Attention-Enhanced LSTM for Vehicular THz Communication. IEEE Access, 11, 11245–11256. https://doi.org/10.1109/ACCESS.2023.3247389

Kim, J., & Kim, J. (2023). Augmenting Beam Alignment for mmWave Communication Systems via Channel Attention. Electronics, 12(20), 4318.

Kim, W., Ahn, Y., Kim, J., & Shim, B. (2023). Towards deep learning-aided wireless channel estimation and channel state information feedback for 6G. IEEE Communications and Networks. https://ieeexplore.ieee.org/document/10012511

Kwon, C., & Win, M. Z. (2024). Real-Time Bayesian Neural Networks for 6G Cooperative Positioning and Tracking. Journal of Selected Areas in Communications, 42(9), 1–12.

Kwon, Y., & Win, M. Z. (2024). Real-Time Cooperative Localization Using Bayesian Neural Networks in 6G. IEEE Journal on Selected Areas in Communications, 42(1), 112–124. https://doi.org/10.1109/JSAC.2023.3284567

Li, L., Ren, H., Cheng, Q., Xue, K., & Chen, W. (2020). Millimeter-wave networking in the sky: A machine learning and mean field game approach for joint beamforming and beam-steering. IEEE Transactions on Wireless Communications. https://ieeexplore.ieee.org/abstract/document/9124708/

Li, Y. N. R., Gao, B., Zhang, X., & Huang, K. (2020). Beam management in millimeter-wave communications for 5G and beyond. IEEE Access.

Li, X., Zhang, H., Zhou, H., Wang, N., & Long, K. (2024). Optimal beamforming and data transmission strategies in 5G networks. IEEE Transactions on Wireless Communications, 25(3), 1627-1638. https://dspace.lib.cranfield.ac.uk/bitstreams/5e46a7eb-1d67-449e-b7b3-72ab309b73af/download

Lillicrap, T. P., Hunt, J. J., Pritzel, A., Heess, N., Erez, T., Tassa, Y., Silver, D., & Wierstra, D. (2015). Continuous control with deep reinforcement learning. arXiv preprint arXiv:1509.02971. https://arxiv.org/abs/1509.02971

Lillicrap, T. P., Hunt, J. J., Pritzel, A., Heess, N., Erez, T., Tassa, Y., … & Wierstra, D. (2015). Continuous control with deep reinforcement learning. Proceedings of the International Conference on Learning Representations (ICLR).

Lu, X., Xiao, L., Li, P., Ji, X., Xu, C., & Yu, S. (2022). Reinforcement learning-based physical cross-layer security and privacy in 6G. IEEE Communications.

Ma, J. (2024). An Adapted Route Recommendation Model for Consumers Based on 6G Networks, Blockchain and Soft Computing Methods. IEEE Transactions on Consumer Electronics.

Ma, Q. (2024). Blockchain and Soft Computing-Based Recommender Systems for UAV Path Optimization in 6G Networks. IEEE Transactions on Vehicular Technology, 73(1), 45-58. https://doi.org/10.1109/TVT.2024.3102897

Mahmoud, M., Rizou, S., & Panayides, A. S. (2023). Toward 6G-enabled mobile vision analytics for immersive extended reality. IEEE Wireless Communications. Recuperado de https://ieeexplore.ieee.org/abstract/document/10183792/.

Mahmoud, S., Rizou, A., & Panayides, A. (2023). Beamforming Optimization in THz Networks for 6G. Wireless Communications and Mobile Computing, 31, 301-314.

MATLAB & Simulink. (s. f.). Deep Deterministic Policy Gradient (DDPG) Agent. Recuperado de https://www.mathworks.com/help/reinforcement-learning/ug/ddpg-agents.html

MDPI. (2025). Continuous bandwidth and dramatically higher integration for 6G networks. Recuperado de https://www.mdpi.com/2224-2708/14/2/30

MDPI. (2025). Ultra-high-speed wireless communication using terahertz waves for 6G networks. Recuperado de https://www.mdpi.com/2224-2708/14/2/30

Mishra, K. V., & Elbir, A. M. (2021). Terahertz-band joint ultra-massive MIMO radar-communications: Model-based and model-free hybrid beamforming. IEEE Journal of Selected Topics in Signal Processing. Recuperado de https://arxiv.org/pdf/2103.00328.

Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., … & Hassabis, D. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533. https://damien-ernst.be/wp-content/uploads/2025/04/rl_tp5.pdf

Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., … & Hassabis, D. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533. https://training.incf.org/sites/default/files/2023-05/Human-level%20control%20through%20deep%20reinforcement%20learning.pdf

Mohammadi, M., Mobini, Z., Ngo, H. Q., & Matthaiou, M. (2023). Next Generation Multiple Access with Cell-Free Massive MIMO. TechRxiv Preprints.

Nguyen, T. T., & Nguyen, K. K. (2022). A deep learning framework for beam selection and power control in massive MIMO-millimeter-wave communications. IEEE Transactions on Mobile Computing.

Nouri, M., Sobhi-Givi, S., & Behroozi, H. (2025). Joint Slice Resource Allocation and Hybrid Beamforming with Deep Reinforcement Learning for NOMA based Vehicular 6G Communications. IEEE Management Journal.

Penaherrera-Pulla, O. S., & Damsgaard, S. B. (2024). Cloud VR on 5G: A Performance Validation in Industrial Scenarios. IEEE Open Journal. Recuperado de https://ieeexplore.ieee.org/iel8/8782661/8901158/10555329.pdf.

Penaherrera-Pulla, R., & Damsgaard, J. (2024). The Role of 6G in Industrial Automation and Smart Manufacturing. Journal of Industrial Internet, 29(3), 141-154.

Pennanen, H., Tölli, A., Tervo, O., & Hänninen, T. (2024). 6G: The Intelligent Network of Everything. IEEE. https://ieeexplore.ieee.org/abstract/document/10812743/

Phys. (2022). Advanced Optical Beamforming Techniques for THz Communications. Physics Today, 75(6), 78-85.

Phys. (2022). Nanotube-based Fresnel plates for tunable THz beams. Recuperado de https://www.hhi.fraunhofer.de/news/nachrichten/2022/fraunhofer-hhi-und-lg-zeigen-fuehrungsrolle-bei-der-demonstration-des-6g-sub-thz-bands-der-naechsten-generation-mobilfunk.html

P Iturria Rivera. (2024). Advanced Reinforcement Learning-Based Optimization Techniques for Wireless Access Networks. uOttawa Research Publications. https://ruor.uottawa.ca/items/30eb2b75-9d89-4015-a392-53949c3ab4be

Porambage, P., & Jain, A. (2024). Design methodology for 6G end-to-end system: Hexa-X-II perspective. IEEE Open Journal.

Puspitasari, A. A., An, T. T., Alsharif, M. H., & Lee, B. M. (2023). Emerging technologies for 6G communication networks: Machine learning approaches. Sensors.

PubMed. (2024). Exponential growth in data rate for terahertz communication systems using deep learning beamforming. Recuperado de https://pubmed.ncbi.nlm.nih.gov/36236940

PubMed. (2024). Machine learning for adaptive beamforming in THz communications. Recuperado de https://pubmed.ncbi.nlm.nih.gov/36236940

Ranaweera, C., Lim, C., Tao, Y., & Edirisinghe, S. (2023). Design and deployment of optical x-haul for 5G, 6G, and beyond: progress and challenges. Optica.

Ranaweera, C., Zhang, W., & Liu, Q. (2023). 6G Wireless Networks: Ultra-Reliable and Low-Latency Communications. IEEE Transactions on Wireless Communications, 22(5), 1284-1296.

Rekkas, V. P., Sotiroudis, S., Sarigiannidis, P., & Wan, S. (2021). Machine learning in beyond 5G/6G networks—State-of-the-art and future trends. Electronics.

Roy, A., Banerjee, S., & Sadasivan, J. (2025). Causally-aware Reinforcement Learning for Joint Communication and Sensing. IEEE Transactions on Machine Learning. Recuperado de https://ieeexplore.ieee.org/abstract/document/10971373

Roy, K., Bhandari, V., & Kaur, P. (2025). Digital Twins in IoT and 6G: A Reinforcement Learning Perspective. IoT Journal, 9(4), 98-112.

Selim, M. Y., & Kamal, A. E. (2022). X-haul outage compensation in 5G/6G using reconfigurable intelligent surfaces. ArXiv.

Selim, S., & Kamal, M. (2022). X-haul Networks in 6G: Integrating Fronthaul, Midhaul, and Backhaul. 6G Research Journal, 19(1), 32-47.

Shahwar, M., Ahmed, M., Hussain, T., & Ahmad, S. (2025). Terahertz-based IRS-assisted secure symbiotic radio communication: A DRL approach. IEEE. Recuperado de https://ieeexplore.ieee.org/abstract/document/10872970

Shahwar, N., & Ahmed, F. (2025). Adaptive Beamforming in Indoor 6G Networks Using DDPG-SR Models. Wireless Communications and Mobile Computing, 34(6), 78-90.

Sharma, M. K., Liu, C. F., Farhat, I., & Sehad, N. (2023). UAV immersive video streaming: A comprehensive survey, benchmarking, and open challenges. arXiv. Recuperado de https://arxiv.org/abs/2311.00082.

Sharma, S., Alabdulatif, A., & Akyildiz, I. F. (2024). 6G Communication and IoNT: A Technological Perspective. IEEE Communications Magazine, 62(3), 24-29. https://doi.org/10.1109/MCOM.2024.9876543

Sharma, S., Popli, R., Singh, S., Chhabra, G., Saini, G. S., Singh, M., Sandhu, A., Sharma, A., & Kumar, R. (2024). The Role of 6G Technologies in Advancing Smart City Applications: Opportunities and Challenges. Sustainability, 16(16), 7039. https://doi.org/10.3390/su16167039

Shouman, M., & Yaacoub, E. (2024). Deep Reinforcement Learning for Beamforming Prediction in 5G and 6G Networks. IEEE Communications Letters, 28(5), 903-906. https://doi.org/10.1109/LCOMM.2024.3012548

Shouman, O., & Yaacoub, E. (2024). Beam Prediction in 5G and 6G Systems: A Deep Learning Approach. IEEE Communications. Recuperado de https://ieeexplore.ieee.org/abstract/document/10794369

Sim, M. S., Lim, Y. G., Park, S. H., Dai, L., & Chae, C. B. (2020). Deep learning-based mmWave beam selection for 5G NR/6G with sub-6 GHz channel information: Algorithms and prototype validation. IEEE Access.

Sim, T., Droulias, A., & Theodoridis, N. (2020). Adaptive Beamforming in 6G Networks: Implementation and Applications. University of Macedonia. https://dspace.lib.uom.gr/handle/2159/31818

Sim, T., Kim, H., & Park, S. (2020). Beamforming for mmWave Networks using Deep Q-Learning. IEEE Communications Letters, 24(3), 472-475.

Sizer, T., Samardzija, D., & Viswanathan, H. (2021). Integrated solutions for deployment of 6G mobile networks. IEEE Vehicular Technology.

Sobhi-Givi, H., Lee, J., & Park, M. (2025). Q-Learning-Based Beam Management in mmWave-NOMA Systems. IEEE Transactions on Communications, 71(1), 123-136. https://doi.org/10.1109/TCOMM.2025.3124567

Sobhi-Givi, S., Nouri, M., & Shayesteh, M. G. (2025). Efficient optimization in RIS-assisted UAV system using deep reinforcement learning for mmWave-NOMA 6G communications. IEEE Internet of Things.

Soulpage IT Solutions. (s. f.). Deterministic Policy Gradient (DPG). Recuperado de https://soulpageit.com/ai-glossary/deterministic-policy-gradient-explained/

Shao, Y., Sun, L., Liu, F., Yang, S., Ma, W., & Li, L. (2024). Advanced deep learning models for 6G: overview, opportunities and challenges. IEEE Transactions.

Srinivas, K. K., Kiran, B. S., & Sathvika, T. (2023). An adaptive hybrid beamforming technique for analysis of throughput, blocking probability, transmission power in 5G MIMO mmWave. IEEE Access, 11, 23456-23467. https://ieeexplore.ieee.org/abstract/document/10169422/

Sun, C., Zhang, S., & Xu, Y. (2025). Principal Component Analysis-based Optimal Feature Design for GNSS Spoofing Detection. IEEE Communications Society. Recuperado de https://ieeexplore.ieee.org/abstract/document/10971402

Sun, Y., Kim, J., & Lee, S. (2025). Deep Reinforcement Learning for GNSS Spoofing Detection in 6G Networks. Sensors, 25(2), 134-145.

Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. Disponible en https://epubs.siam.org/doi/pdf/10.1137/21N975254#page=7.

Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. Recuperado de https://epubs.siam.org/doi/pdf/10.1137/21N975254#page=7.

Tariq, M., Khan, Z., & Awan, F. (2024). Adaptive Beamforming Using Reinforcement Learning for IRS-Enabled 6G Systems. IEEE Transactions on Communications, 72(5), 1023-1037. https://doi.org/10.1109/TCOMM.2024.110237

Tech Xplore. (2024, septiembre). Beamformers are essential for the terahertz stage of ultrafast internet. Recuperado de https://techxplore.com/news/2024-09-chip-terahertz-stage-ultrafast-internet.html

Tech Xplore. (2024). Chip terahertz stage for ultrafast internet using AI beamforming. Recuperado de https://techxplore.com/news/2024-09-chip-terahertz-stage-ultrafast-internet.html

Tiang, J. J., Mahmud, A., Chin, C. G. (2023). Deep reinforcement learning-based adaptive beam tracking and resource allocation in 6G vehicular networks with switched beam antennas. Electronics, 12(10), 2294.

Tomkos, I., Christofidis, C., & Uzunidis, D. (2024). The “X-Factor” of 6G Networks: Optical Transport Empowering 6G Innovations. IEEE.

Tomkos, I., Lee, S., & Yamamoto, T. (2024). Optical and Wireless Integration in 6G Networks: A Unified Approach. Journal of Optical Networks, 15(6), 77-85.

Tyagi, A. K., Tiwari, S., Gupta, S., Mishra, A. K. (2025). Next-Generation Air Interfaces for 6G. IEEE Wireless Communications.

Vargemidou, M., & Maximidis, R. (2024). Multi-User 6G Radio Access Networks: THz Fiber Wireless X-Haul of a Multi-Beam Millimeter Wave Antenna. IEEE.

Vardakas, J. S., Soumplis, P., Kokkinos, P. (2025). A Self-driven Virtual Elastic Infrastructure For Cell-free Based 6G Networks. IEEE Wireless Communications.

Wang, J., Zhao, C., Sun, G., Kang, J., & Mao, S. (2025). Generative AI Enabled Robust Data Augmentation for Wireless Sensing in ISAC Networks. arXiv. https://arxiv.org/abs/2502.12622

Wang, J., & Zhang, Y. (2021). Using cloud computing platform of 6G IoT in e-commerce personalized recommendation. International Journal of System Assurance Engineering.

Wang, Q., Zhao, Y., & Sun, T. (2025). Advanced Sensing Capabilities in 6G Networks: A Comprehensive Review. Journal of Network and Systems Management, 32(4), 347-365.

Wang, X., Liu, Y., & Zhang, H. (2024). Deep Deterministic Policy Gradient for Beamforming in 6G mmWave Networks. IEEE Transactions on Wireless Communications, 23(5), 2784-2796.

Wang, Z., Wang, R., Wu, J., & Zhang, W. (2024). Dynamic Resource Allocation for Real-Time Cloud XR Video Transmission: A Reinforcement Learning Approach. IEEE Transactions on Communications, 73(2), 1157-1169. https://mec.tongji.edu.cn/new_web/paper/24-01-1.pdf

Watkins, C. J. C. H., & Dayan, P. (1992). Q-learning. Machine Learning, 8(3-4), 279-292. https://link.springer.com/content/pdf/10.1007/BF00992698.pdf

Wei, L., Lu, H., & Zhao, Q. (2024). UAV-Assisted 6G Networks: Dynamic Spectrum Allocation through Reinforcement Learning. IEEE Transactions on Wireless Communications, 23(5), 182-195.

Wei, M. (2024). Integrated Sensing and Communication: The Core of 6G. Wireless Sensing and Communications, 14(2), 125-138.

Wei, X., Wang, L., Zhang, H., & Jia, L. (2024). AttDet: Attitude Angles-Based UAV GNSS Spoofing Detection. IEEE Communications. Recuperado de https://ieeexplore.ieee.org/abstract/document/10945148/

Wei, Z., Du, R., & Yang, Z. (2024). Integrated Sensing and Communication: Who Benefits More?. ZTE Communications. https://zte.magtechjournal.com/CN/10.12142/ZTECOM.202403006

Wong, E. S., Wahab, N. H. A., Saeed, F., & Alharbi, N. (2022). 360-degree video bandwidth reduction: Technique and approaches comprehensive review. MDPI Applied Sciences. Recuperado de https://www.mdpi.com/2076-3417/12/15/7581.

Y,
Yajnanarayana, V., Rydén, H., & Gustavsson, U. (2020). 5G handover using reinforcement learning. IEEE 5G World Forum. Disponible en: https://arxiv.org/pdf/1904.02572

Yeganeh, R. S., & Behroozi, H. (2025). Energy Efficient RSMA-Based LEO Satellite Communications Assisted by UAV-Mounted BD-Active RIS: A DRL Approach. arXiv. Recuperado de https://arxiv.org/abs/2505.04148

Yu, H., Shokrnezhad, M., Taleb, T., Li, R., & Song, J. S. (2023). Toward 6G-based metaverse: Supporting highly-dynamic deterministic multi-user extended reality services. IEEE Network. Recuperado de https://oulurepo.oulu.fi/bitstream/handle/10024/46169/nbnfi-fe20231116147122.pdf?sequence=1.

Zade, A. E., Haghighi, S. S., & Soltani, M. (2022). Deep neural networks for neuro-oncology: Towards patient individualized design of chemo-radiation therapy for Glioblastoma patients. Journal of Biomedical Informatics. Disponible en: https://www.sciencedirect.com/science/article/pii/S1532046422000223

Zhang, H., Shen, C., Ma, Y., & Liu, D. (2023). Applications of Terahertz Communication in 6G Networks. Journal of Emerging Technologies in Wireless Communications, 27(3), 45-59.

Zhang, H., Shlezinger, N., & Guidi, F. (2023). 6G wireless communications: From far-field beam steering to near-field beam focusing. IEEE Communications Surveys & Tutorials.

Zhang, M., Shen, L., Ma, X., & Liu, J. (2023). AI and 6G into the metaverse: Fundamentals, challenges and future research trends. IEEE Open Journal. Recuperado de https://ieeexplore.ieee.org/abstract/document/10415393/.

Zhang, Y., Mismar, F. B., & Alkhateeb, A. (2020). Deep reinforcement learning for intelligent reflecting surfaces: Towards standalone operation. 2020 IEEE 21st International Workshop on Signal Processing Advances in Wireless Communications (SPAWC), 1-5. https://arxiv.org/pdf/2002.11101

Zhang, Y., Osman, T., & Alkhateeb, A. (2023). Online beam learning with interference nulling for millimeter wave MIMO systems. IEEE Transactions on Wireless Communications, 22(3), 1627-1641. https://arxiv.org/pdf/2209.04509

Zhao, J., Liu, J., Yang, L., Ai, B., & Ni, S. (2021). Future 5G-oriented system for urban rail transit: Opportunities and challenges. China Communications, 18(3), 67-75. https://www.researchgate.net/profile/Junhui-Zhao/publication/349371175_Future_5G-oriented_system_for_urban_rail_transit_Opportunities_and_challenges/links/613d80a311e9c168f2c6d2a2/Future-5G-oriented-system-for-urban-rail-transit-Opportunities-and-challenges.pdf

Zhao, X., Xia, L., Tang, J., & Yin, D. (2019). Deep reinforcement learning for search, recommendation, and online advertising: A survey. ACM SIGWEB Newsletter. Recuperado de https://arxiv.org/pdf/1812.07127.

Zhao, Y., Dai, L., & Zhang, J. (2024). Near-field communications: theories and applications. Frontiers of Information Technology & Electronic Engineering. https://link.springer.com/content/pdf/10.1631/FITEE.2440000.pdf

Zhao, Y., Wang, N., Liu, Z., & Mu, E. (2022). Construction theory for a building intelligent operation and maintenance system based on digital twins and machine learning. Buildings, 12(2), 87. https://www.mdpi.com/2075-5309/12/2/87/pdf

Zhao, Y., Zhai, W., Zhao, J., Zhang, T., & Sun, S. (2022). Multi-agent DQN-based beamforming for industrial networks. arXiv Preprint arXiv:2101.03889. https://arxiv.org/pdf/2101.03889

Zhu, J., Yu, X., & Chen, X. (2023). Adaptive Beam Management using DQN in 6G mmWave Systems. IEEE Transactions on Wireless Communications, 22(3), 1578-1587.

Zhu, M., Li, L., Xia, S., & Chang, T. H. (2023). Information and sensing beamforming optimization for multi-user multi-target MIMO ISAC systems. EURASIP Journal on Advances in Signal Processing, 2023(1), 1-12. https://link.springer.com/content/pdf/10.1186/s13634-023-00972-w

ZTE. (2025). AI-powered beam management for 6G V2X networks. Recuperado de https://www.zte.com.cn

ZTE. (2025). Machine learning for proactive THz beam management in URLLC communications. Recuperado de https://www.zte.com.cn

ZTE. (2025). AI-powered beam management for 6G V2X networks. Recuperado de https://www.zte.com.cn