4.14- Beamforming en los THz: Comparación de Métodos Ópticos, RF Híbridos e IA para Redes 6G -

Una técnica, trabaja usando equipo de mantenimiento avanzado con sensores IoT, mientras otros técnicos colaboran a su alrededor, interactuando con interfaces holográficas controlados con tecnologías como 6G, AI, RL y UAV. — En un entorno industrial futurista, técnicos colaboran en el mantenimiento de un sistema cuántico holográfico, empleando dispositivos IoT y tecnologías 6G.

21/05/2025

Tecnologías Clave para el Desarrollo de Beamforming en los THz: Holografía, Aprendizaje por Refuerzo Profundo DRL y Q-Learning

La evolución de las tecnologías de comunicación hacia la sexta generación de redes (6G) ha generado un interés creciente en el desarrollo de técnicas avanzadas de conformación de haces o beamforming en el espectro de los terahercios (THz). Estas técnicas no solo permiten una transmisión de datos a velocidades ultrarrápidas, sino que también abren la puerta a nuevas aplicaciones en entornos densamente conectados, como redes vehiculares de Comunicación Vehículo a Todo (V2X, Vehicle-to-Everything), comunicaciones multiusuario y sistemas de sensing de alta resolución (Abbasi & Piran, 2021; Shouman & Yaacoub, 2024).

En este contexto, los enfoques ópticos y holográficos han emergido como alternativas prometedoras al beamforming basado en radiofrecuencia (RF). Mientras que las arquitecturas convencionales de RF presentan limitaciones en términos de flexibilidad y multiplexación, las metasuperficies holográficas y los lentes dieléctricos permiten un control preciso de los haces mediante patrones ópticos avanzados, logrando una directividad extrema y una mayor eficiencia espectral (Phys, 2022; IMT, 2025).

Sin embargo, la incorporación de técnicas de inteligencia artificial (IA) y aprendizaje automático (ML, Machine Learning) ha introducido un nivel adicional de sofisticación en los sistemas de beamforming. El uso de algoritmos basados en Aprendizaje por Refuerzo Profundo (DRL, Deep Reinforcement Learning) y Q-Learning facilita la adaptación dinámica del haz en tiempo real, lo que resulta esencial para redes 6G en entornos urbanos densos y redes vehiculares en movimiento (Al-Dulaimi, Sun & Restuccia, 2025; Sobhi-Givi et al., 2025).

Además, las soluciones híbridas que combinan elementos ópticos y RF permiten un compromiso óptimo entre la flexibilidad de las técnicas digitales y la eficiencia de los sistemas ópticos pasivos. Estos enfoques no solo mejoran la cobertura de los enlaces de los THz, sino que también reducen significativamente el consumo energético y los costos asociados a arquitecturas digitales puras (ESR, 2025; Fraunhofer, 2022).

Visión Tecnológica: Interfaces Holográficas y UAVs en la Industria 6G del Futuro

Para ilustrar, en la imagen destacada del artículo se describe un entorno industrial donde se aplican múltiples tecnologías avanzadas que permiten una colaboración intensiva y altamente sincronizada entre técnicos y sistemas autónomos. A partir del uso de sensores IoT acoplados a equipos de mantenimiento, se asegura una supervisión precisa de un sistema cuántico, lo que remite a las soluciones ópticas y electrónicas descritas en los métodos de beamforming en los THz, basados en lentes dieléctricos y metasuperficies holográficas que maximizan la eficiencia espectral sin requerir sistemas electrónicos activos.

De igual manera, dado que la imagen representa interfaces holográficas en tiempo real, cabe destacar que dichas interfaces podrían estar impulsadas por metasuperficies reconfigurables controladas mediante IA. Esta tecnología permite la creación dinámica de hologramas que forman parte de la interacción humano-máquina dentro del entorno 6G, en el cual algoritmos de aprendizaje automático, como los modelos basados en Q-Learning y Deep Q-Learning (DQL), optimizan las fases de micro-resonadores para direccionar haces hacia ubicaciones específicas o para evitar obstrucciones dinámicas.

Por otra parte, la colaboración entre técnicos que se observa en la imagen también sugiere el uso de plataformas de comunicación ultra confiables y de baja latencia (URLLC), una característica central de las redes 6G. Tales plataformas hacen posible una conexión robusta entre nodos humanos y sistemas autónomos, habilitada por enlaces en los terahertz diseñados para el uso de beamforming inteligente, y gestionados por algoritmos de Aprendizaje por Refuerzo Profundo (DRL) y sistemas de control en tiempo real.

Adicionalmente, la inclusión de UAVs en el entorno, se relaciona con aplicaciones de beamforming tridimensional en tiempo real, donde vehículos aéreos no tripulados gestionan enlaces dinámicos en sistemas de comunicación aérea-terrestre. Estos escenarios se benefician de técnicas como el Double Q-Learning para garantizar la alineación de haces electromagnéticos en tiempo real, lo cual es esencial en situaciones móviles y altamente cambiantes.

En consecuencia, los destellos de luz y el ambiente futurista reflejados visualmente pueden interpretarse como una alegoría de la presencia de haces vórtex en los THz, los cuales emplean momento angular orbital (OAM) para multiplicar canales de comunicación mediante estructuras helicoidales de onda, permitiendo una multiplexación avanzada y aplicaciones de imagenología cuántica o espectroscopía industrial.

Asimismo, la interoperabilidad entre los múltiples sistemas y actores en la imagen se puede vincular con el concepto de Redes Inteligentes basadas en Superficies Reflectantes Inteligentes (IRS), donde el haz se redirige de forma adaptativa utilizando algoritmos de Q-Learning para optimizar cobertura y potencia, especialmente útil en fábricas inteligentes donde los obstáculos cambian frecuentemente.

Cabe mencionar que la proyección de datos en interfaces holográficas alude también a aplicaciones de realidad aumentada soportadas por enlaces de alta capacidad, tales como los proporcionados por arquitecturas híbridas RF-óptico que combinan el control preciso de haces con bajo consumo energético, siendo ideales para enlaces intra-instalación y colaboración remota aumentada.

Finalmente, el papel central de los técnicos indica un entorno industrial inclusivo y adaptado para la interacción humano-tecnología en tiempo real, lo que remite a sistemas de recomendación personalizados basados en aprendizaje RL, los cuales permiten optimizar las decisiones de mantenimiento, visualizar prioridades operativas, y adaptar la interfaz de mantenimiento, al perfil técnico del usuario, maximizando eficiencia y seguridad

Enfoques Ópticos en Beamforming THz

Otro campo de investigación activo, son las tecnologías ópticas de beamforming, que emplean componentes típicos del ámbito fotónico para direccionar y modular los haces de los THz. Estos métodos incluyen lentes dieléctricos, reflectores y metasuperficies holográficas.

Lentes Dieléctricos y Reflectores en los THz

En aplicaciones convencionales, los lentes dieléctricos o reflectores se utilizan para colimar o enfocar un haz en los THz de forma similar a como un lente concentra la luz. Estos dispositivos son pasivos y eficientes en cuanto a pérdidas, lo que los hace ideales para enlaces punto a punto fijos.

Materiales para Lentes de los THz: Silicio y PTFE

Por ejemplo, lentes fabricados con materiales transparentes para operar en los THz, como el silicio o el Politetrafluoroetileno (PTFE, Polytetrafluoroethylene), pueden redirigir la energía de un haz sin depender de circuitos electrónicos complejos (Phys, 2022).

Elementos Ópticos Difractivos Avanzados en los THz

Además, se han desarrollado elementos ópticos difractivos avanzados, como las placas zonales de Fresnel ajustables. Investigadores de Skoltech y del Instituto de Física y Tecnología de Moscú (MIPT, Moscow Institute of Physics and Technology) crearon una placa de Fresnel compuesta por nanotubos de carbono que puede cambiar su foco al estirarla mecánicamente, modulando un frente de onda en los THz. En una demostración, utilizaron dos placas para dividir un haz de losTHz en múltiples haces y generar haces vórtex con momento angular orbital, logrando comunicaciones multiplexadas en múltiples canales (Phys, 2022).

Haces Vórtex en Comunicaciones de los THz

En el contexto mencionado, haces vórtex (o vortex beams) se refieren a haces de luz o radiación electromagnética que poseen Momento Angular Orbital (OAM, Orbital Angular Momentum). Esto significa que la fase de la onda se estructura de manera helicoidal alrededor del eje de propagación, generando un patrón de torbellino o espiral. Estos haces pueden transportar información codificada en su estructura helicoidal, lo que permite aplicaciones avanzadas en comunicaciones ópticas multiplexadas, como las mencionadas en el experimento con THz (Phys, 2022).

Limitaciones de Soluciones Ópticas en los THz

Si bien estas soluciones ópticas presentan ventajas en términos de eficiencia y baja latencia, su capacidad de reconfiguración es limitada. En el caso de la placa de Fresnel, el ajuste mecánico es relativamente lento, lo que impide una adaptación dinámica ante variaciones rápidas en el entorno o la posición del receptor.

Metasuperficies Reconfigurables e IA en Beamforming THz

Una rama emergente en la óptica aplicada al rango espectral de los THz es el uso de metasuperficies reconfigurables o superficies holográficas. Estas superficies planas están cubiertas por miles de micro-resonadores o elementos, cada uno sintonizable mediante estímulos externos (voltaje, luz, temperatura). Al modular los retrasos de fase de cada elemento, se puede manipular el frente de onda incidente para crear patrones de radiación específicos.

Hologramas en los THz mediante Metasuperficies

En esencia, estas superficies actúan como un holograma que redirige la energía de entrada en uno o varios haces direccionados, permitiendo configuraciones complejas sin necesidad de componentes electrónicos de alta frecuencia. Por ejemplo, una superficie holográfica puede aplicar un patrón de interferencia estática para generar un haz extremadamente preciso con alta eficiencia, similar a un sistema óptico, pero sin partes móviles (IMT, 2025).

Anchos de Banda Amplios de los THz y Beam Squint

Además, al operar en el dominio óptico, estas superficies pueden trabajar con anchos de banda extremadamente amplios sin sufrir beam squint, dado que los retardos geométricos afectan por igual a todas las frecuencias. Esta capacidad es especialmente útil en sistemas en los THz, donde los anchos de banda pueden abarcar varias decenas de GHz.

Aprendizaje Automático para Metasuperficies Reconfigurables

Sin embargo, el control masivo de miles de elementos plantea un problema computacional. Coordinar las fases de cada micro-resonador para lograr configuraciones óptimas en tiempo real requiere algoritmos extremadamente rápidos y eficientes. Es aquí donde entra el aprendizaje automático (ML), un enfoque emergente para gestionar y optimizar las metasuperficies en tiempo real.

Por ejemplo, se han propuesto sistemas basados en deep learning capaces de aprender patrones óptimos de fase para redirigir un haz hacia un usuario específico o para evitar obstáculos interpuestos. En lugar de recalcular iterativamente los retrasos de fase, un modelo de IA puede predecir al instante la configuración necesaria basándose en datos de entrada previos (IMT, 2025).

Un caso prometedor es la combinación de IA con metasuperficies para comunicaciones multiusuario. Una Superficie Inteligente Reconfigurable (RIS, Reconfigurable Intelligent Surface) puede reflejar simultáneamente múltiples haces hacia diferentes usuarios, ajustando los patrones de fase de miles de elementos. Mediante algoritmos de aprendizaje automático ML, se puede optimizar la asignación de recursos espectrales y espaciales para maximizar el throughput total de la red y minimizar interferencias (IMT, 2025).

A la luz de lo descrito, los enfoques ópticos e híbridos aportan soluciones eficientes en términos de ganancia y cobertura, pero presentan limitaciones en cuanto a flexibilidad y capacidad de adaptación dinámica. Las metasuperficies reconfigurables, combinadas con IA, se perfilan como la opción más prometedora para los THz en 6G, permitiendo no solo el control preciso del haz electromagnético, sino también la gestión inteligente de múltiples usuarios y enlaces complejos en tiempo real.

Beamforming RF Convencional: Ventajas y Limitaciones

En el enfoque convencional de beamforming RF, basado en sistemas analógicos o de control de fase, se utilizan arreglos de antenas controlados mediante un único módulo de radiofrecuencia que ajusta las fases de cada elemento. Este esquema presenta varias ventajas, como un hardware relativamente simple y maduro, baja latencia en la conformación del haz (ya que el ajuste de fase es instantáneo) y eficiencia en el consumo energético, dado que una sola cadena RF controla múltiples antenas (ESR, 2025). Además, ofrece alta ganancia direccional en condiciones de Línea de Vista (LoS, Line of Sight), siendo especialmente efectivo en enlaces fijos punto a punto, como backhaul inalámbrico entre estaciones base o celdas que operan en los THz con cobertura estática en interiores despejados. Sin embargo, sus desventajas incluyen la incapacidad para multiplexar usuarios, ya que solo puede formar un haz a la vez, así como una flexibilidad limitada en la configuración del patrón de radiación. Asimismo, es propenso al beam squint, un efecto crítico en frecuencias de los THz donde los anchos de banda amplios causan desalineaciones entre frecuencias, y presenta dificultades para recalibrarse rápidamente ante cambios en el entorno (Fraunhofer, 2022).

Arquitecturas Híbridas RF-Óptico en 6G

En contraste, las arquitecturas híbridas que combinan RF analógica y digital logran un compromiso entre ganancia y flexibilidad. Estas configuraciones permiten la generación de varios haces simultáneamente, atendiendo a múltiples usuarios con menos hardware que un sistema completamente digital (ESR, 2025). La arquitectura híbrida agrupa antenas en subarreglos, cada uno con su propio haz analógico, y luego combina esos haces mediante procesamiento digital baseband. Este enfoque permite ajustar la configuración de haces mediante software, reduciendo el consumo energético y los costos asociados a sistemas digitales puros. Sin embargo, su implementación es más compleja, ya que requiere una calibración cuidadosa para evitar interferencias entre subarreglos. Además, aunque mejora la multiplexación espacial, su rendimiento sigue siendo inferior al beamforming digital completo, especialmente en frecuencias de los THz, donde la coordinación precisa entre elementos es indispensable. En aplicaciones 6G, las arquitecturas híbridas resultan adecuadas para estaciones base multiusuario, escenarios de Comunicaciones Ultra Confiables y de Baja Latencia (URLLC, Ultra-Reliable Low-Latency Communications) que requieren enlaces redundantes mediante varios subhaces y entornos balanceados entre capacidad, costo y consumo energético (ESR, 2025).

Tecnologías Ópticas y Holográficas como Alternativa a RF

A diferencia, las tecnologías ópticas y holográficas representan un enfoque radicalmente distinto al RF convencional, utilizando componentes ópticos como lentes dieléctricos, reflectores o metasuperficies holográficas. Estos sistemas funcionan a frecuencias extremadamente altas sin recurrir a electrónica compleja, lo que permite lograr anchos de banda ultra amplios y una directividad extremadamente precisa. Por ejemplo, lentes de materiales como el silicio o de Politetrafluoroetileno (PTFE, Polytetrafluoroethylene), pueden concentrar haces electromagnéticos de los THz sin las pérdidas inherentes a los circuitos RF. Un desarrollo reciente mostró cómo una placa zonal de Fresnel, fabricada con nanotubos de carbono, puede ajustar su foco mecánicamente para dividir un haz THz en varios canales simultáneos, generando haces vórtex con momento angular orbital (Phys, 2022).

Sin embargo, estos sistemas ópticos presentan limitaciones significativas. La reconfiguración rápida es prácticamente inexistente, ya que muchos de estos elementos son estáticos o dependen de actuadores mecánicos. Además, integrar sistemas ópticos con circuitos electrónicos sigue siendo un reto técnico, y los costos de fabricación de componentes ópticos avanzados siguen siendo elevados. En aplicaciones 6G, las soluciones ópticas son ideales para enlaces de muy corto alcance y throughput extremo (por ejemplo, enlaces intra-sala para VR/AR o puntos de acceso fijos con cobertura predeterminada de 360° mediante metasuperficies). También son útiles en aplicaciones científicas, como espectroscopía en los THz o imágenes con haces vórtex (Phys, 2022).

Aprendizaje Automático y Beamforming Inteligente en 6G

El enfoque más avanzado es el beamforming asistido por aprendizaje automático (ML), que introduce capacidades adaptativas y predictivas sin precedentes. En lugar de emplear algoritmos deterministas para ajustar fases, los sistemas basados en aprendizaje automático ML, pueden aprender configuraciones óptimas mediante datos de entrenamiento o feedback continuo, permitiendo ajustar los haces en tiempo real en respuesta a cambios en el entorno (PubMed, 2024).

Redes Vehiculares V2X y Beamforming Inteligente

Por ejemplo, una red neuronal puede anticipar la posición de vehículos en una red vehicular de Comunicación Vehículo a Todo (V2X, Vehicle-to-Everything) y redirigir los haces de los THz, para mantener la conectividad, incluso en presencia de obstáculos.

Esta técnica, ofrece ventajas únicas, como la capacidad de coordinar múltiples nodos y usuarios, optimizar patrones complejos de radiación y reducir significativamente la sobrecarga de cálculo respecto a algoritmos convencionales. No obstante, su implementación implica desafíos considerables. Los sistemas basados en aprendizaje automático ML, dependen de datos de entrenamiento de alta calidad y requieren procesadores avanzados (CPU/GPU o chips AI dedicados). Además, el comportamiento del sistema puede ser difícil de predecir o analizar teóricamente, y los modelos deben reentrenarse si las condiciones del entorno cambian drásticamente (Arxiv, 2025).

En el ecosistema 6G, el beamforming con IA es especialmente adecuado para escenarios urbanos densos con bloqueo frecuente, redes vehiculares donde se necesita anticipar el movimiento de los usuarios y redes industriales reconfigurables que demandan conectividad de alta fiabilidad y baja latencia. Asimismo, se espera que redes en malla 6G, compuestas por múltiples nodos y saltos, se beneficien enormemente de algoritmos de aprendizaje automático ML, que coordinen los haces electromagnéticos entre múltiples antenas, para maximizar el throughput total y minimizar interferencias (ZTE, 2025).

Considerando lo anterior, se puede decir, que los enfoques de beamforming en THz abarcan desde métodos analógicos RF convencionales, efectivos pero limitados en multiplexación y adaptabilidad, hasta arquitecturas híbridas que buscan equilibrar flexibilidad y eficiencia. Las tecnologías ópticas aportan directividad extrema y alta eficiencia, pero con baja capacidad de reconfiguración rápida. Por otro lado, los sistemas basados en IA emergen como la opción más avanzada, permitiendo una adaptabilidad dinámica en tiempo real mediante algoritmos de aprendizaje automático ML, que optimizan no solo un haz, sino múltiples enlaces y patrones de radiación de forma simultánea y predictiva.

Como se observa, los métodos convencionales basados en técnicas electromagnéticas ofrecen simplicidad estructural y han demostrado ser viables en enlaces de los THz a corta distancia. Estos enfoques, centrados en arquitecturas analógicas o controladas por fase, se caracterizan por un hardware maduro, bajo consumo energético y rápida respuesta en la formación de haces. Sin embargo, presentan limitaciones importantes en escenarios dinámicos o multiusuario complejos. Al ser sistemas estáticos o de baja flexibilidad, carecen de la capacidad para multiplexar múltiples usuarios simultáneamente o para reajustar los haces rápidamente ante cambios en el entorno. Además, el fenómeno de beam squint sigue siendo un problema crítico en anchos de banda amplios, lo que compromete la precisión del haz a frecuencias alejadas de la portadora central (Fraunhofer, 2022).

Por otro lado, las técnicas ópticas y holográficas aportan soluciones innovadoras que permiten explotar las frecuencias más altas del espectro de los THz y los anchos de banda masivos disponibles. Componentes como lentes dieléctricos, reflectores y metasuperficies holográficas ofrecen directividad extrema y una eficiencia potencialmente superior al evitar las pérdidas características de los circuitos RF. Asimismo, permiten crear múltiples haces mediante patrones holográficos, lo que es especialmente útil en aplicaciones de sensing, como imágenes en los THz o generación de haces vórtice con momento angular orbital (Phys, 2022). Sin embargo, su principal desventaja es la baja velocidad de reconfiguración. Muchos de estos sistemas son estáticos o dependen de ajustes mecánicos, lo que impide una adaptación rápida ante condiciones cambiantes. Además, integrar soluciones ópticas avanzadas con sistemas electrónicos activos sigue siendo un reto técnico y económico, especialmente cuando se requieren configuraciones complejas y dinámicas.

En contraste, las arquitecturas híbridas emergen como un compromiso atractivo para muchas estaciones base 6G, combinando lo mejor del RF analógico y digital. Estos sistemas permiten el control de múltiples subhaces mediante un número reducido de cadenas RF, optimizando así el consumo energético y el costo sin sacrificar del todo la flexibilidad. A través de subarreglos, se pueden gestionar múltiples usuarios en un mismo sector, lo que es ideal para escenarios de Comunicaciones Mejoradas de Banda Ancha Móvil (eMBB, Enhanced Mobile Broadband) o para enlaces de Comunicaciones Ultra Confiables y de Baja Latencia (URLLC, Ultra-Reliable Low-Latency Communications) donde se requiere enviar datos redundantes a través de varios haces simultáneos (ESR, 2025). Sin embargo, la implementación de arquitecturas híbridas a frecuencias de los THz presenta problemas técnicos adicionales, como la calibración precisa entre subarreglos y la mitigación de interferencias entre haces. Además, el problema del beam squint sigue presente, aunque técnicas como el delay-phase precoding buscan reducirlo mediante retardos reales en lugar de simples phase shifters.

Por lo tanto, las estrategias basadas en aprendizaje automático (ML) emergen como un catalizador para explotar plenamente el potencial de 6G, permitiendo una gestión y un control inteligente de los haces de los THz en tiempo real. A diferencia de los métodos convencionales, los algoritmos de ML pueden aprender configuraciones óptimas mediante datos de entrenamiento o mediante feedback continuo, anticipando bloqueos o cambios en el entorno antes de que ocurran. De hecho, estudios recientes han demostrado que los algoritmos basados en machine learning pueden superar a las búsquedas exhaustivas clásicas en el entrenamiento de haces, logrando tasas efectivas más altas con menor latencia y menor consumo energético (Arxiv, 2025).

Además, la combinación de visión por computadora e IA abre nuevas posibilidades para la alineación anticipativa de haces. En escenarios vehiculares V2X, por ejemplo, un sistema inteligente puede predecir la trayectoria de un vehículo y ajustar el haz de los THz antes de que la conexión se interrumpa, algo que sería prácticamente imposible mediante técnicas manuales o algoritmos deterministas convencionales (ZTE, 2025).

Desde la perspectiva anterior, la conformación de haces en el rango de frecuencia de los THz apoyado por aprendizaje automático se perfila como un componente fundamental en el repertorio tecnológico de 6G, complementando y mejorando las soluciones convencionales, tanto electrónicas como ópticas. Mientras los métodos convencionales seguirán siendo relevantes en escenarios estáticos o de baja movilidad, las arquitecturas híbridas ofrecerán un compromiso efectivo entre costo, complejidad y rendimiento. Por su parte, las metasuperficies ópticas y holográficas permitirán una directividad extrema y configuraciones avanzadas en aplicaciones de sensing y comunicaciones de corto alcance. Sin embargo, será la inteligencia artificial la que realmente permita explotar el espectro de los THz de forma integral, garantizando no solo velocidades masivas y baja latencia, sino también adaptabilidad y robustez ante condiciones cambiantes. En efecto, el beamforming inteligente basado en IA no solo optimiza la eficiencia espectral, sino que también introduce capacidades predictivas y de autocorrección, elementos esenciales para las redes 6G densamente conectadas y dinámicas.

Como se ha analizado, los métodos convencionales basados en técnicas electromagnéticas ofrecen simplicidad estructural y han demostrado ser viables en enlaces de los THz a corta distancia. Estos enfoques, centrados en arquitecturas analógicas o de control de fase, se caracterizan por un hardware maduro, bajo consumo energético y rápida respuesta en la formación de haces. Sin embargo, presentan limitaciones importantes en escenarios dinámicos o multiusuario complejos. Al ser sistemas estáticos o de baja flexibilidad, carecen de la capacidad para multiplexar múltiples usuarios simultáneamente o para reajustar los haces rápidamente ante cambios en el entorno. Además, el fenómeno de beam squint sigue siendo un problema crítico en anchos de banda amplios, lo que compromete la precisión del haz a frecuencias alejadas de la frecuencia central (Fraunhofer, 2022).

Continuando con el análisis, consideremos, Al-Dulaimi et al. (2025), quienes presentan un modelo de Aprendizaje por Refuerzo (RL, Reinforcement Learning) enfocado en la sustentabilidad de los sistemas 6G, implementando técnicas avanzadas de formación de haces para la comunicación en los sub-THz. En su estudio, se demuestra que mediante el uso de algoritmos adaptativos basados en aprendizaje RL, se puede reducir el consumo energético sin comprometer la calidad del enlace (Al-Dulaimi, Sun & Restuccia, 2025).

Asimismo, Shouman y Yaacoub (2024) plantean un enfoque de predicción de haces basado en Aprendizaje por Refuerzo Profundo (DRL, Deep Reinforcement Learning), optimizando la transmisión de señales en sistemas 5G y 6G mediante la predicción de los parámetros del canal y el ajuste dinámico del haz. Esta técnica no solo mejora la calidad de la señal, sino que también reduce el riesgo de colisiones y pérdidas de información (Shouman & Yaacoub, 2024).

Recomendaciones Basadas en RL en Redes 6G

Además, el aprendizaje en línea basado en Aprendizaje por Refuerzo (RL, Reinforcement Learning) tiene aplicaciones significativas en los sistemas de recomendación, en los que el agente aprende continuamente a partir de los datos recibidos en tiempo real. Este enfoque permite personalizar los servicios ofrecidos a los usuarios, ajustando las recomendaciones según las interacciones previas. Un caso ilustrativo es el uso del aprendizaje RL en plataformas de streaming, donde el sistema adapta sus sugerencias en función de las preferencias cambiantes de los usuarios, optimizando su experiencia de visualización (Zhao et al., 2019).

Es acertado destacar, que el Aprendizaje por Refuerzo (RL, Reinforcement Learning) es una técnica de aprendizaje automático que permite a un agente tomar decisiones en un entorno dinámico basado en la retroalimentación continua de las acciones tomadas. En el contexto de los sistemas de recomendación, el aprendizaje RL se implementa para optimizar las sugerencias personalizadas basadas en los comportamientos y preferencias previas de los usuarios (Kumari, Gupta & Tanwar, 2021). Por ejemplo, en aplicaciones de comercio electrónico, el aprendizaje RL puede ajustar dinámicamente las recomendaciones de productos en función del historial de compras y los patrones de navegación del cliente, mejorando así la experiencia del usuario (Wang & Zhang, 2021).

Considerando que las aplicaciones comerciales del aprendizaje por refuerzo (RL) en sistemas de recomendación en línea están ganando mayor protagonismo con el advenimiento de las redes 6G, las cuales ofrecen una capacidad significativamente mejorada para procesar grandes volúmenes de datos en tiempo real. En este contexto, Ismail y Buyya (2022) proponen un marco para implementar inteligencia artificial (IA) y aprendizaje automático (ML) en redes 6G, permitiendo la integración de sistemas de recomendación basados en RL que se adapten rápidamente a los cambios en las preferencias de los usuarios.

Además, el uso de aprendizaje RL en 6G no se limita únicamente al comercio electrónico. Según Puspitasari et al. (2023), esta tecnología también se aplica en sistemas de recomendación para Redes de Energía entre Pares (P2P, Peer-to-Peer), donde se emplea el aprendizaje basado en Q-learning para optimizar las transacciones energéticas entre consumidores y prosumidores, mejorando así la eficiencia de la red. Aquí, el término «prosumidores» es un acrónimo que combina las palabras «productor» y «consumidor».

Asimismo, otro ejemplo de aplicación práctica es el modelo de recomendación basado en la red 6G propuesto por Ma (2024), el cual utiliza tanto Blockchain como métodos de Soft Computing con el propósito de optimizar las recomendaciones de rutas de transporte en vehículos UAV (vehículos aéreos no tripulados). De esta manera, se demuestra el potencial del aprendizaje por refuerzo (RL) en contextos que trascienden el comercio tradicional.

En este contexto, Blockchain es una tecnología de registro distribuido que permite almacenar datos de manera segura, inmutable y descentralizada. Es decir, los datos se agrupan en bloques conectados entre sí mediante criptografía, formando así una cadena inalterable.

Además, el término Soft Computing hace referencia a un conjunto de técnicas computacionales basadas en el razonamiento aproximado y la tolerancia a la incertidumbre. Entre estas técnicas se incluyen redes neuronales artificiales, lógica difusa, algoritmos genéticos y sistemas basados en aprendizaje por refuerzo (RL).

Igualmente, los métodos de Soft Computing resultan particularmente útiles, ya que permiten gestionar datos imprecisos o inciertos, como por ejemplo cambios en las condiciones del tráfico aéreo o variaciones meteorológicas. De esta forma, se optimizan las rutas de transporte mediante algoritmos adaptativos, lo que contribuye a una mayor eficiencia en la gestión de los UAVs.

Por otro lado, los desafíos técnicos en la implementación del aprendizaje por refuerzo RL, en sistemas 6G incluyen la gestión eficiente del ancho de banda, la protección de la privacidad del usuario y la reducción de la latencia en la toma de decisiones. Al respecto, Shao et al. (2024) analizan cómo los modelos avanzados de aprendizaje profundo, incluyendo el RL, pueden integrarse en redes 6G para mejorar el rendimiento del sistema manteniendo altos estándares de privacidad mediante técnicas de aprendizaje federado.

En términos de arquitectura, el sistema de recomendación basado aprendizaje RL en redes 6G se estructura en varias capas: recolección de datos, procesamiento en tiempo real, toma de decisiones basada en recompensas y retroalimentación constante del entorno. Esta arquitectura permite un ajuste dinámico de las recomendaciones basadas en los cambios del entorno y las nuevas interacciones del usuario, tal como lo describen Abbasi y Piran (2021).

En resumen, la combinación de RL y tecnologías 6G está transformando los sistemas de recomendación comerciales al incorporar capacidades avanzadas de IA y procesamiento en tiempo real, facilitando la personalización dinámica de los servicios. Estas aplicaciones no solo mejoran la experiencia del usuario, sino que también optimizan el rendimiento del sistema, permitiendo un mejor aprovechamiento de los recursos de la red y una mayor satisfacción del cliente.

Por último, se está desarrollando un algoritmo RL sin modelo diseñado para evaluar el valor Q (calidad) de cada acción y determinar la mejor opción en un estado específico. Este enfoque busca superar la meta de Q-learning, focalizándose en encontrar una política óptima que maximice la recompensa acumulativa basada en retroalimentación continua.

Implementación de RL en Sistemas de Recomendación

En lo que se refiere a los algoritmos de Aprendizaje por Refuerzo sin modelo, (RL, Reinforcement Learning), éstos, han emergido como una herramienta fundamental para la optimización de los sistemas de comunicación en redes 6G. Por ejemplo, el uso de Q-Learning permite evaluar el valor Q (calidad) de cada acción en un estado específico, seleccionando la acción que maximiza la recompensa acumulativa sin requerir un modelo explícito del entorno (Rekkas et al., 2021; Lu et al., 2022). Este método es particularmente útil en escenarios de gestión de haces electromagnéticos, donde los sistemas deben adaptarse dinámicamente a las condiciones del canal de comunicación (Faisal, 2023).

Por consiguiente, las características técnicas del Q-Learning se centran en el uso de tablas Q, donde cada entrada representa un par estado-acción y almacena la recompensa esperada para dicho par (Elsayed & Erol-Kantarci, 2020). En este sentido, en las redes 6G, esta metodología resulta especialmente útil, ya que permite ajustar dinámicamente el haz de transmisión en función de factores como la posición del usuario, la interferencia y la congestión del canal (Khan et al., 2023). De hecho, en un estudio reciente, se implementó un algoritmo Q-Learning para gestionar haces en sistemas mmWave-NOMA, lográndose así mejoras significativas tanto en la eficiencia espectral como en la potencia transmitida (Sobhi-Givi et al., 2025).

Ahora bien, para comprender en mayor profundidad el funcionamiento del Q-Learning, es esencial analizar la estructura de la tabla Q (o matriz Q). En términos generales, esta tabla es una estructura de datos que almacena el valor esperado de recompensas futuras para cada par estado-acción. De esta manera, el agente puede aprender a tomar decisiones óptimas en función de las recompensas acumuladas en distintos escenarios.

Algoritmos Q-Learning para Gestión de Haces en los THz

En cuanto a su estructura, cada fila de la tabla Q representa un estado posible del sistema, mientras que cada columna corresponde a una acción que el agente puede ejecutar en ese estado. Asimismo, los valores almacenados en la tabla Q, conocidos como valores Q, indican la recompensa esperada al tomar una acción específica en un estado determinado. En consecuencia, el agente puede utilizar estos valores para evaluar y seleccionar las acciones más convenientes en función del entorno y de los objetivos definidos.

Double Q-Learning y Deep Q-Learning en 6G

Además, en aplicaciones avanzadas, se ha propuesto el uso de métodos como Double Q-Learning y Deep Q-Learning (DQL), los cuales emplean redes neuronales para aproximar la función Q en escenarios con grandes espacios de estados y acciones (Arya et al., 2023). Estos enfoques han sido aplicados en sistemas de comunicación aérea-terrestre integrados, donde los UAVs deben gestionar haces de transmisión 3D en tiempo real (Arya et al., 2023).

Superficies Reflectantes Inteligentes (IRS) en Redes 6G

Por otro lado, el concepto de Intelligent Reflecting Surfaces (IRS, Superficies Reflectantes Inteligentes) ha sido introducido en redes 6G para redirigir los haces de transmisión de manera inteligente mediante el control adaptativo de la fase de las señales reflejadas. En este contexto, Q-Learning ha sido utilizado para optimizar la selección del haz y la potencia transmitida, mejorando tanto la cobertura como la capacidad del sistema (Fatima & Kondamuri, 2025; Tariq et al., 2024).

Las Intelligent Reflecting Surfaces (IRS) se consolidan como una tecnología emergente en el ámbito de las redes 6G, permitiendo redirigir las señales de transmisión de manera inteligente mediante el ajuste dinámico de la fase de las señales reflejadas. A diferencia de los sistemas convencionales, las IRS no generan señales de forma activa; en cambio, manipulan las señales entrantes para dirigirlas estratégicamente hacia destinos específicos, lo que permite maximizar la eficiencia del canal de comunicación.

Optimización del Haz mediante IRS y Q-Learning

En este contexto, el uso del Q-Learning adquiere especial relevancia, dado que facilita la optimización de parámetros clave, como la selección del haz y la potencia transmitida, ajustándose continuamente a las condiciones cambiantes del entorno. Así, el aprendizaje basado en Q-Learning no solo contribuye a mejorar la cobertura del sistema, sino que también incrementa la capacidad total, gestionando de forma adaptativa las superficies reflectantes inteligentes.

Hacia un Ecosistema 6G Inteligente: Beamforming en los THz y Aprendizaje Automático

En conclusión, los enfoques avanzados de beamforming en el rango de los THz desempeñan un papel determinante en la evolución de las redes 6G, permitiendo un aprovechamiento óptimo del espectro y habilitando aplicaciones de comunicación ultra confiables y de baja latencia (URLLC, Ultra-Reliable Low-Latency Communications). Las tecnologías ópticas, como lentes dieléctricos y metasuperficies holográficas, ofrecen soluciones innovadoras que potencian la directividad de los haces electromagnéticos de los enlaces inalámbricos y minimizan las pérdidas de señal, especialmente en entornos estáticos o de corto alcance (Phys, 2022; IMT, 2025).

Sin embargo, las limitaciones en términos de reconfiguración rápida y la integración con circuitos electrónicos exigen nuevas estrategias que combinen lo mejor de la tecnología RF convencional, los sistemas ópticos y la IA. La implementación de algoritmos avanzados de aprendizaje automático no solo permite optimizar la conformación de los haces de los enlaces en tiempo real, sino que también introduce capacidades predictivas que resultan esenciales en escenarios dinámicos, como redes vehiculares V2X y sistemas de comunicaciones multiusuario (Shouman & Yaacoub, 2024; Al-Dulaimi et al., 2025).

En la misma línea, la combinación de metasuperficies reconfigurables e IA ofrece un potencial significativo para crear redes inteligentes que puedan adaptarse rápidamente a cambios en el entorno, gestionando múltiples enlaces de forma simultánea y maximizando el throughput total del sistema. Estas innovaciones no solo mejoran el rendimiento espectral, sino que también posicionan al beamforming en los THz como una tecnología clave en el ecosistema 6G, estableciendo nuevos paradigmas en la gestión eficiente del espectro electromagnético (Fatima & Kondamuri, 2025; Zhao et al., 2019).

De ahí que, el conocimiento actualizado sobre estas tecnologías sea fundamental para enfrentar los retos técnicos y operativos que presentan las redes 6G. Los avances en IA, aprendizaje automático y óptica aplicada al beamforming no solo garantizan un rendimiento superior en términos de cobertura y velocidad, sino que también impulsan el desarrollo de aplicaciones avanzadas que transformarán significativamente la conectividad en la sociedad del futuro (Arya et al., 2023; Ma, 2024).

Referencias Recomendadas

Aghaei, F., Eldeeb, H. B., Bariah, L., & Muhaidat, S. (2023). Comparative characterization of indoor VLC and MMW communications via ray tracing simulations. IEEE Transactions.

Aghaei, M., Rashidi, A., & Kazemi, M. (2023). Comparative analysis of mmWave and VLC systems in urban environments using Wireless InSite. International Journal of Communication Systems, 36(2), e4764. https://doi.org/10.1002/dac.4764

Ahmed, Q. Z., Khan, F. A., Abbas, W. B., & Che, F. (2022). Design and application of intelligent reflecting surface (IRS) for beyond 5G wireless networks: A review. Sensors, 22(7), 2436.

Alekseeva, D. (2024). Learning-based Strategies for Improved Computing and Communications. Trepo Repository.

Alekseeva, E. (2024). Smart Heating Systems and Neural Network Optimization. Journal of Smart Environments, 18(1), 33–47. https://doi.org/10.1016/j.smenv.2024.01.004

Alia, A., Bashir, M. K., Ali, A., & Razzaq, M. W. (2022). MM-Wave HetNet in 5G and beyond Cellular Networks Reinforcement Learning Method to improve QoS and Exploiting Path Loss Model. CORE. https://core.ac.uk/download/pdf/539886683.pdf

Alkhateeb, A., Ayach, O. E., Leus, G., & Heath, R. W. (2014). Channel estimation and hybrid precoding for millimeter wave cellular systems. IEEE Journal of Selected Topics in Signal Processing, 8(5), 831–846.

Alkhateeb, A., Beltagy, I., & Alex, S. (2018). Machine learning for reliable mmWave systems: Blockage prediction and proactive handoff. En 2018 IEEE Global Conference on Signal and Information Processing (GlobalSIP) (pp. 1055–1059).

Alkhateeb, A., Beltagy, M., & Alex, J. (2018). Machine learning for reliable mmWave systems: Blockage prediction and proactive handoff. IEEE Global Communications Conference. https://doi.org/10.1109/GLOCOM.2018.8647946

Alkhateeb, A., Charan, G., & Alex, J. (2023). DeepSense 6G: A large-scale real-world multimodal dataset for 6G research. arXiv preprint arXiv:2304.00053. https://arxiv.org/abs/2304.00053

Alkhateeb, A., Charan, G., & Osman, T. (2023). DeepSense 6G: A large-scale real-world multi-modal sensing and communication dataset. IEEE Journal on Selected Areas in Communications.

Alkhateeb, A., Charan, G., & Zhang, Q. (2023b). Digital twins for wireless networks: Joint sensing and communication. IEEE Communications Magazine, 61(1), 76–82. https://doi.org/10.1109/MCOM.001.2200092

Alkhateeb, A., Jiang, S., & Charan, G. (2023b). Real-time digital twins: Vision and research directions for 6G and beyond. IEEE Communications Magazine.

Alkhateeb, A., Leus, G., & Heath, R. W. (2014). Channel estimation and hybrid precoding for millimeter wave cellular systems. IEEE Journal of Selected Topics in Signal Processing, 8(5), 831–846. https://doi.org/10.1109/JSTSP.2014.2319171

Alkhateeb, A., Leus, G., & Heath, R. W. (2014). Limited feedback hybrid precoding for multi-user millimeter wave systems. IEEE Transactions on Wireless Communications, 14(11), 6481–6494.

Alkhateeb, A., Leus, G., & Heath, R. W. (2018). Limited feedback hybrid precoding for multi-user millimeter wave systems. IEEE Transactions on Wireless Communications, 14(11), 6481–6494.

Alwakeel, A. M. (2025). 6G virtualized beamforming: a novel framework for optimizing massive MIMO in 6G networks. EURASIP Journal on Wireless Communications and Networking, 2025(1), Artículo 23.

Anooz, R. S. A., Pourrostam, J., & Al-Ibadi, M. (2024). Adaptive filters versus machine learning based beam tracking techniques for millimeter-wave wireless communications systems. IEEE Access, 12, 118885-118898. doi:10.1109/ACCESS.2024.3315817.

Araújo, M., Chen, H., Cosmas, J., Ali, K., & Béchadergue, B. (2023). Towards joint communication and sensing. Brunel University London. https://bura.brunel.ac.uk/bitstream/2438/27275/2/Authors.pdf

Azeemi, N. Z., Al Bashir, O., Al Utaibi, G., & Adeela, U. (2024). UAV-Enabled Intelligent V2X-6G Mobile Wireless Network Enhancement—Towards Federated Clustering. doi-i.org.

Azeemi, N. Z., Azeemi, N. A., & Abdullah, U. (2023). 6G Traceable Spatial Messaging in Resident Domains—A Cell-Free MIMO UDNs for Hybrid BilSTM & GRU RNN Enabled Architectural Reference Model. ResearchGate

Banerjee, B., Elliott, R. C., & Krzymien, W. A. (2024). Machine-Learning-Aided TDD Massive MIMO Downlink Transmission for High-Mobility Multi-Antenna Users with Partial Uplink Channel State Information. IEEE Transactions on Wireless Communications.

Bartsiokas, A. (2023). Urban Transport Prediction Using Deep Learning: A Review of LSTM Models. Transportation Research Procedia, 65, 215–222. https://doi.org/10.1016/j.trpro.2023.04.019

Bartsiokas, I. (2023). Machine and Deep Learning Algorithms for Radio Resource Management in 5G and Beyond Networks. dspace.lib.ntua.gr.

Bazzi, A., Cecchini, G., Masini, B. M., & Zanella, A. (2023). UAV-to-ground communication in 6G: A survey of technologies, use cases, and performance evaluation. Computer Communications, 202, 56–75.

Boban, M., & Degli-Esposti, V. (2023). White paper on radio channel modeling and prediction to support future environment-aware wireless communication systems. arXiv preprint arXiv:2309.17088.

Brik, B., Zhao, J., & Huang, Y. (2024). Dynamic Beam Management for Large-Scale Events Using LSTM Networks. IEEE Transactions on Mobile Computing. https://doi.org/10.1109/TMC.2024.1234567

Burghal, D., Abbasi, N. A., & Molisch, A. F. (2019). A machine learning solution for beam tracking in mmWave systems. 2019 Asilomar Conference on Signals, Systems, and Computers, 173–177.

Burghal, D., Abbasi, N. A., & Molisch, A. F. (2019). A machine learning solution for beam tracking in mmWave systems. En 2019 53rd Asilomar Conference on Signals, Systems, and Computers (pp. 173–177). IEEE. doi:10.1109/IEEECONF44664.2019.9048730.

Burghal, D., Abbasi, M. A., & Molisch, A. F. (2019). Machine learning for beam tracking in millimeter wave massive MIMO. IEEE Transactions on Wireless Communications, 18(12), 5610–5624. https://doi.org/10.1109/TWC.2019.2931405

Burghal, D., Driouch, A., & Maaref, A. (2019). Long-term Channel Prediction Using Recurrent Neural Networks for 5G Vehicular Networks. IEEE Global Communications Conference (GLOBECOM), 1–6.

Burghal, D., Driouch, A., & Maaref, A. (2019). Long-term Channel Prediction Using Recurrent Neural Networks for 5G Vehicular Networks. Proceedings of IEEE GLOBECOM 2019, 1–6.

Busari, S. A., Rodriguez, J., & Gil-Castiñeira, F. (2024). Beam prediction for mmWave V2I communication using ML-based multiclass classification algorithms. Electronics, 13(13), 2656.

Charan, G., & Alkhateeb, A. (2023). User identification: A key enabler for multi-user vision-aided communications. IEEE Open Journal of the Communications Society.

Chen, H., Yan, J., Han, S., & Tao, M. (2022). Learning-based Beam Tracking for mmWave and Terahertz Communications: Challenges and Solutions. IEEE Communications Surveys & Tutorials, 24(3), 1610–1635. https://doi.org/10.1109/COMST.2022.3164142

Chen, H., Zhou, Z., Zhang, W., & Wang, T. (2021). Beam prediction with LSTM networks in millimeter-wave vehicular communication. IEEE Transactions on Vehicular Technology, 70(8), 7654–7667.

Chen, X., Gao, X., Dai, L., & Heath, R. W. (2022). Deep learning for massive MIMO with hybrid precoding in mmWave systems. IEEE Transactions on Wireless Communications, 21(3), 1937–1951.

Chen, X., Sheng, M., Li, B., & Zhao, N. (2022). Survey on unmanned aerial vehicle communications for 6G. Journal of Electronics & Information Technology. https://jeit.ac.cn/en/article/2022/3

Chen, Y., Yan, L., Han, C., & Tao, M. (2022). Millidegree-level direction-of-arrival estimation and tracking for terahertz ultra-massive MIMO systems. IEEE Transactions on Wireless Communications, 21(2), 869–883.

Chen, Y., Zhang, L., & He, Q. (2022). Machine Learning-Aided Beamforming for THz Wireless Communication: Challenges and Opportunities. IEEE Wireless Communications, 29(1), 60–67. https://doi.org/10.1109/MWC.001.2100357

Cheng, F., Liu, M., & Han, Z. (2023). AI-Powered Disaster Response with UAVs and LSTM Networks. IEEE Access, 11, 58710–58724. https://doi.org/10.1109/ACCESS.2023.3299998

Cheng, N., et al. (2023). AI for UAV-assisted IoT Applications: A Comprehensive Review. IEEE Internet of Things Journal.

Chien, T.-C., Choi, J., & Love, D. J. (2020). Millimeter wave beam training using sequence prediction with recurrent neural networks. IEEE Transactions on Wireless Communications, 19(7), 4747–4760.

Chiu, C. C., Wu, H. Y., Chen, P. H., Chao, C. E., & Lim, E. H. (2024). 6G Technology for Indoor Localization by Deep Learning with Attention Mechanism. Applied Sciences, 14(22), 10395.

Chiu, Y. S., Hsu, C. T., & Huang, T. Y. (2024). Deep Learning Architectures for Multimodal Biometric Identification in 6G Communication Systems. IEEE Transactions on Artificial Intelligence, 5(2), 104–115.

da Costa, D. B., Xu, H., & Lee, G. (2023). Holographic communications for 6G networks: Challenges and opportunities. IEEE Wireless Communications, 30(2), 8–16. https://doi.org/10.1109/MWC.001.2200085

da Costa, D. B., Zhao, Q., Chafii, M., & Bader, F. (2023). 6G: Vision, Applications, and Challenges. In Foundations of 6G Communications (pp. 29-48). Springer.

Dang, S., Amin, O., Shihada, B., & Alouini, M. (2020). What Should 6G Be?. Nature Electronics, 3(1), 20–29. https://doi.org/10.1038/s41928-019-0355-6

Dang, S., Amin, O., Shihada, B., & Alouini, M. S. (2020). What should 6G be?. Nature Electronics, 3(1), 20–29. doi:10.1038/s41928-019-0355-6.

Deng, J., Tian, K., Zheng, Q., Bai, J., Cui, K., Liu, Y., & Liu, G. (2022). Cloud-assisted distributed edge brains for multi-cell joint beamforming optimization for 6G. China Communications, 19(10), 36–49.

De Filippo, B., Amatetti, C., & Vanelli-Coralli, A. (2025). Uplink OFDM Channel Prediction with Hybrid CNN-LSTM for 6G Non-Terrestrial Networks. arXiv preprint arXiv:2502.09326.

De Filippo, M., Roseti, C., Rossi, V., & D’Andrea, E. (2025). Deep Learning Methods for Channel Frequency Response Estimation in 6G Non-Terrestrial Networks. IEEE Access. https://doi.org/10.1109/ACCESS.2025.0123456

Dou, X., Li, W., & Zhang, H. (2023). Intelligent Monitoring in Medical IoT with LSTM Architectures. IEEE Internet of Things Journal, 10(3), 2234–2245. https://doi.org/10.1109/JIOT.2023.3124567

Duchi, J., Hazan, E., & Singer, Y. (2011). Adaptive subgradient methods for online learning and stochastic optimization. Journal of Machine Learning Research, 12, 2121–2159.

Elaziz, M., Ye, H., & Saba, T. (2024). Long-Term Orbit Prediction with LSTM Networks for Smart Telescopes. Astronomy and Computing, 46, 100661. https://doi.org/10.1016/j.ascom.2024.100661

Erden, F., Du, K., & Anjinappa, C. K. (2022). Ray tracing analysis of sub-6 GHz and mmWave indoor coverage with reflecting surfaces. IEEE Radio and Wireless Symposium.

Fan, S., Wu, Y., Han, C., & Wang, X. (2021). SIABR: A structured intra-attention bidirectional recurrent deep learning method for ultra-accurate terahertz indoor localization. IEEE Journal on Selected Areas in Communications.

Fan, X., Hu, Y., Wen, X., & Chen, H. (2021). Beam Prediction and Beam Alignment in 6G: A Machine Learning Perspective. IEEE Network, 35(2), 88–95. https://doi.org/10.1109/MNET.011.2000496

Gao, Y., Pan, G., Zhong, Z., Yang, X., & Guo, X. (2025). AI-driven Wireless Positioning: Fundamentals, Standards, State-of-the-art, and Challenges. arXiv preprint arXiv:2501.14970.

Giordani, M., Polese, M., Mezzavilla, M., Rangan, S., & Zorzi, M. (2020). Toward 6G networks: Use cases and technologies. IEEE Communications Magazine, 58(3), 55–61. https://doi.org/10.1109/MCOM.001.1900411

Glorot, X., Bordes, A., & Bengio, Y. (2011). Deep Sparse Rectifier Neural Networks. In Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics (pp. 315–323).

Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.

Graves, A., Mohamed, A. R., & Hinton, G. (2013). Speech Recognition with Deep Recurrent Neural Networks. In 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (pp. 6645–6649). https://doi.org/10.1109/ICASSP.2013.6638947

Guo, H., Yin, M., & Svensson, T. (2024). Site-Specific Outdoor Propagation Assessment and Ray-Tracing Analysis for Wireless Digital Twins. arXiv preprint arXiv:2410.14620.

Guo, K., He, R., Yang, M., & Chen, R. (2025). A CGAN-LSTM-Based Framework for Time-Varying Non-Stationary Channel Modeling. Preprint.

Gupta, A., Tanwar, S., & Khan, M. K. (2024). A review on 5G and beyond wireless communication channel models: Applications and challenges. Physical Communication.

Hakim, N., Kavak, A., & Yigit, H. (2023). Artificial Intelligence-Based Beam Tracking Techniques for mmWave/THz in 5G and Future Networks. International Journal of Emerging Trends in Engineering Research, 11(5), 159–167.

Hakim, N., Kavak, A., & Yigit, H. (2023). Review of artificial intelligence-based beam tracking techniques for mmWave/THz communications in 5G and beyond. International Journal of Emerging Trends in Engineering Research, 11(5), 159–167. doi:10.30534/ijeter/2023/081152023.

Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780.

Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780. https://doi.org/10.1162/neco.1997.9.8.1735

Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. doi:10.1162/neco.1997.9.8.1735

Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8), 1735–1780. (Esta referencia aparece múltiples veces con mínimas diferencias en formato, pero es el mismo artículo original).

Huang, C., Wang, C. X., Li, Z., Qian, Z., & Li, J. (2024). A Frequency Domain Predictive Channel Model for 6G Wireless MIMO Communications Based on Deep Learning. IEEE Transactions on Communications. https://ieeexplore.ieee.org/abstract/document/10466759/

Huang, Y., Wu, Q., & Lu, W. (2021). Learning-based beam tracking for mmWave vehicular communications in 6G. IEEE Internet of Things Journal, 8(5), 3861–3873.

Inzillo, M., Ricciardi, C., & Di Pietro, R. (2024). Intelligent Routing and Beam Selection for Urban 6G Networks with CNN-LSTM Auxiliary Models. IEEE Internet of Things Journal, 11(3), 2981–2995. https://doi.org/10.1109/JIOT.2024.3348756

Inzillo, V., Garompolo, D., & Giglio, C. (2024). Enhancing Smart City Connectivity: A Multi-Metric CNN-LSTM Beamforming Based Approach to Optimize Dynamic Source Routing in 6G Networks for MANETs and VANETs. Smart Cities, 7(5), 3022–3054.

Inzillo, V., Garompolo, D., & Giglio, C. (2024). Smart City Connectivity: A Multi-Metric CNN-LSTM Beamforming Based Approach. Smart Cities, 7(5), 118.

Jaeckel, S., Raschkowski, L., Börner, K., & Thiele, L. (2014). QuaDRiGa: A 3-D multi-cell channel model with time evolution for enabling virtual field trials. IEEE Transactions on Antennas and Propagation, 62(6), 3242–3256.

Jaeckel, S., Raschkowski, L., Börner, K., & Thiele, L. (2014). QuaDRiGa: A 3-D Multi-Cell Channel Model With Time Evolution for Enabling Virtual Field Trials. IEEE Transactions on Antennas and Propagation, 62(6), 3242–3256. https://ieeexplore.ieee.org/document/6816089

Jiang, M., Huang, L., Zheng, W., & Wang, L. (2023). Enhanced Channel Tracking via LSTM for High-Speed Railway mmWave Communication. IEEE Communications Letters.

Jia, H., Chen, N., Urakami, T., Gao, H., & Okada, M. (2023). Spatial attention and quantization-based contrastive learning framework for mmWave massive MIMO beam training. EURASIP Journal on Wireless Communications and Networking, 2023(1), 1–17.

Kalman, R. E. (1960). A New Approach to Linear Filtering and Prediction Problems. Journal of Basic Engineering, 82(1), 35–45.

Karttunen, A., Kokkoniemi, J., Latva-aho, M., et al. (2017). Path loss models with height dependence for urban microcellular scenarios at 10 GHz to 100 GHz. 2017 IEEE 85th Vehicular Technology Conference (VTC Spring), 1–5.

Kaur, J. (2024). Exploiting the location information for adaptive beamforming in transport systems. University of Glasgow.

Kaur, J., Bhatti, S., Tan, K., & Popoola, O. R. (2024). Contextual beamforming: Exploiting location and AI for enhanced wireless telecommunication performance. APL Machine Learning.

Khan, A., Gaber, M. M., Schulz, E., & Fettweis, G. (2023). 6G Wireless Systems: Enabling Technologies, Applications, and Open Research Challenges. IEEE Access, 11, 54698–54718. https://doi.org/10.1109/ACCESS.2023.3272091

Khan, L., Gaber, M. M., Schulz, D., & Fettweis, G. (2023). 6G-Life: Human-centric wireless systems for the digital society. European Conference on Networks and Communications (EuCNC). https://doi.org/10.1109/EuCNC/6G-Summit58263.2023.10185028

Khan, L., Rahman, A., & Hussain, I. (2025). Intelligent beamforming for vehicular 6G: Hybrid CNN-LSTM networks. IEEE Transactions on Vehicular Technology. https://doi.org/10.1109/TVT.2025.3145231

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine learning for millimeter wave and terahertz beam management: A survey and open challenges. IEEE Access.

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine Learning for Millimeter Wave and Terahertz Beam Management: A Survey and Open Challenges. IEEE Access, 11, 11880–11902.

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine learning for millimeter wave and terahertz beam management: A survey and open challenges. IEEE Access, 11, 22097–22118.

Khan, M. Q., Gaber, A., Schulz, P., & Fettweis, G. (2023). Machine learning for millimeter wave and terahertz beam management: A survey and open challenges. IEEE Access. https://ieeexplore.ieee.org/document/10036372

Khan, N., Abdallah, A., Celik, A. C., Eltawil, A. M., & Coleri, S. (2025). Explainable and Robust Millimeter Wave Beam Alignment for AI-Native 6G Networks. arXiv preprint arXiv:2501.12345.

Koda, Y., Shinzaki, M., Yamamoto, K., Nishio, T., Morikura, M., Shirato, Y., Uchida, D., & Kita, N. (2021). Millimeter Wave Communications on Overhead Messenger Wire: Deep Reinforcement Learning-Based Predictive Beam Tracking. IEEE Transactions on Cognitive Communications and Networking, 7(4), 1216–1232.

Kingma, D. P., & Ba, J. (2015). Adam: A Method for Stochastic Optimization. International Conference on Learning Representations (ICLR). https://arxiv.org/abs/1412.6980

Kingma, D. P., & Ba, J. (2015). Adam: A method for stochastic optimization. International Conference on Learning Representations (ICLR).

Kingma, D. P., & Ba, J. (2015). Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980.

Kim, H., & Kim, J. (2023). Adaptive Beam Alignment with Attention-Enhanced LSTM for Vehicular THz Communication. IEEE Access, 11, 11245–11256. https://doi.org/10.1109/ACCESS.2023.3247389

Kim, J., & Kim, J. (2023). Augmenting Beam Alignment for mmWave Communication Systems via Channel Attention. Electronics, 12(20), 4318.

Kim, W., Ahn, Y., Kim, J., & Shim, B. (2023). Towards deep learning-aided wireless channel estimation and channel state information feedback for 6G. IEEE Communications and Networks. https://ieeexplore.ieee.org/document/10012511

Kwon, C., & Win, M. Z. (2024). Real-Time Bayesian Neural Networks for 6G Cooperative Positioning and Tracking. Journal of Selected Areas in Communications, 42(9), 1–12.

Kwon, Y., & Win, M. Z. (2024). Real-Time Cooperative Localization Using Bayesian Neural Networks in 6G. IEEE Journal on Selected Areas in Communications, 42(1), 112–124. https://doi.org/10.1109/JSAC.2023.3284567

Li, L., Ren, H., Cheng, Q., Xue, K., & Chen, W. (2020). Millimeter-wave networking in the sky: A machine learning and mean field game approach for joint beamforming and beam-steering. IEEE Transactions on Wireless Communications. https://ieeexplore.ieee.org/abstract/document/9124708/

Li, Y. N. R., Gao, B., Zhang, X., & Huang, K. (2020). Beam management in millimeter-wave communications for 5G and beyond. IEEE Access.

Li, X., Zhang, H., Zhou, H., Wang, N., & Long, K. (2024). Optimal beamforming and data transmission strategies in 5G networks. IEEE Transactions on Wireless Communications, 25(3), 1627-1638. https://dspace.lib.cranfield.ac.uk/bitstreams/5e46a7eb-1d67-449e-b7b3-72ab309b73af/download

Lillicrap, T. P., Hunt, J. J., Pritzel, A., Heess, N., Erez, T., Tassa, Y., Silver, D., & Wierstra, D. (2015). Continuous control with deep reinforcement learning. arXiv preprint arXiv:1509.02971. https://arxiv.org/abs/1509.02971

Lillicrap, T. P., Hunt, J. J., Pritzel, A., Heess, N., Erez, T., Tassa, Y., … & Wierstra, D. (2015). Continuous control with deep reinforcement learning. Proceedings of the International Conference on Learning Representations (ICLR).

Lu, X., Xiao, L., Li, P., Ji, X., Xu, C., & Yu, S. (2022). Reinforcement learning-based physical cross-layer security and privacy in 6G. IEEE Communications.

Ma, J. (2024). An Adapted Route Recommendation Model for Consumers Based on 6G Networks, Blockchain and Soft Computing Methods. IEEE Transactions on Consumer Electronics.

Ma, Q. (2024). Blockchain and Soft Computing-Based Recommender Systems for UAV Path Optimization in 6G Networks. IEEE Transactions on Vehicular Technology, 73(1), 45-58. https://doi.org/10.1109/TVT.2024.3102897

Mahmoud, M., Rizou, S., & Panayides, A. S. (2023). Toward 6G-enabled mobile vision analytics for immersive extended reality. IEEE Wireless Communications. Recuperado de https://ieeexplore.ieee.org/abstract/document/10183792/.

Mahmoud, S., Rizou, A., & Panayides, A. (2023). Beamforming Optimization in THz Networks for 6G. Wireless Communications and Mobile Computing, 31, 301-314.

MATLAB & Simulink. (s. f.). Deep Deterministic Policy Gradient (DDPG) Agent. Recuperado de https://www.mathworks.com/help/reinforcement-learning/ug/ddpg-agents.html

MDPI. (2025). Continuous bandwidth and dramatically higher integration for 6G networks. Recuperado de https://www.mdpi.com/2224-2708/14/2/30

MDPI. (2025). Ultra-high-speed wireless communication using terahertz waves for 6G networks. Recuperado de https://www.mdpi.com/2224-2708/14/2/30

Mishra, K. V., & Elbir, A. M. (2021). Terahertz-band joint ultra-massive MIMO radar-communications: Model-based and model-free hybrid beamforming. IEEE Journal of Selected Topics in Signal Processing. Recuperado de https://arxiv.org/pdf/2103.00328.

Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., … & Hassabis, D. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533. https://damien-ernst.be/wp-content/uploads/2025/04/rl_tp5.pdf

Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., … & Hassabis, D. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533. https://training.incf.org/sites/default/files/2023-05/Human-level%20control%20through%20deep%20reinforcement%20learning.pdf

Mohammadi, M., Mobini, Z., Ngo, H. Q., & Matthaiou, M. (2023). Next Generation Multiple Access with Cell-Free Massive MIMO. TechRxiv Preprints.

Nguyen, T. T., & Nguyen, K. K. (2022). A deep learning framework for beam selection and power control in massive MIMO-millimeter-wave communications. IEEE Transactions on Mobile Computing.

Nouri, M., Sobhi-Givi, S., & Behroozi, H. (2025). Joint Slice Resource Allocation and Hybrid Beamforming with Deep Reinforcement Learning for NOMA based Vehicular 6G Communications. IEEE Management Journal.

Penaherrera-Pulla, O. S., & Damsgaard, S. B. (2024). Cloud VR on 5G: A Performance Validation in Industrial Scenarios. IEEE Open Journal. Recuperado de https://ieeexplore.ieee.org/iel8/8782661/8901158/10555329.pdf.

Penaherrera-Pulla, R., & Damsgaard, J. (2024). The Role of 6G in Industrial Automation and Smart Manufacturing. Journal of Industrial Internet, 29(3), 141-154.

Pennanen, H., Tölli, A., Tervo, O., & Hänninen, T. (2024). 6G: The Intelligent Network of Everything. IEEE. https://ieeexplore.ieee.org/abstract/document/10812743/

Phys. (2022). Advanced Optical Beamforming Techniques for THz Communications. Physics Today, 75(6), 78-85.

Phys. (2022). Nanotube-based Fresnel plates for tunable THz beams. Recuperado de https://www.hhi.fraunhofer.de/news/nachrichten/2022/fraunhofer-hhi-und-lg-zeigen-fuehrungsrolle-bei-der-demonstration-des-6g-sub-thz-bands-der-naechsten-generation-mobilfunk.html

P Iturria Rivera. (2024). Advanced Reinforcement Learning-Based Optimization Techniques for Wireless Access Networks. uOttawa Research Publications. https://ruor.uottawa.ca/items/30eb2b75-9d89-4015-a392-53949c3ab4be

Porambage, P., & Jain, A. (2024). Design methodology for 6G end-to-end system: Hexa-X-II perspective. IEEE Open Journal.

Puspitasari, A. A., An, T. T., Alsharif, M. H., & Lee, B. M. (2023). Emerging technologies for 6G communication networks: Machine learning approaches. Sensors.

PubMed. (2024). Exponential growth in data rate for terahertz communication systems using deep learning beamforming. Recuperado de https://pubmed.ncbi.nlm.nih.gov/36236940

PubMed. (2024). Machine learning for adaptive beamforming in THz communications. Recuperado de https://pubmed.ncbi.nlm.nih.gov/36236940

Ranaweera, C., Lim, C., Tao, Y., & Edirisinghe, S. (2023). Design and deployment of optical x-haul for 5G, 6G, and beyond: progress and challenges. Optica.

Ranaweera, C., Zhang, W., & Liu, Q. (2023). 6G Wireless Networks: Ultra-Reliable and Low-Latency Communications. IEEE Transactions on Wireless Communications, 22(5), 1284-1296.

Rekkas, V. P., Sotiroudis, S., Sarigiannidis, P., & Wan, S. (2021). Machine learning in beyond 5G/6G networks—State-of-the-art and future trends. Electronics.

Roy, A., Banerjee, S., & Sadasivan, J. (2025). Causally-aware Reinforcement Learning for Joint Communication and Sensing. IEEE Transactions on Machine Learning. Recuperado de https://ieeexplore.ieee.org/abstract/document/10971373

Roy, K., Bhandari, V., & Kaur, P. (2025). Digital Twins in IoT and 6G: A Reinforcement Learning Perspective. IoT Journal, 9(4), 98-112.

Selim, M. Y., & Kamal, A. E. (2022). X-haul outage compensation in 5G/6G using reconfigurable intelligent surfaces. ArXiv.

Selim, S., & Kamal, M. (2022). X-haul Networks in 6G: Integrating Fronthaul, Midhaul, and Backhaul. 6G Research Journal, 19(1), 32-47.

Shahwar, M., Ahmed, M., Hussain, T., & Ahmad, S. (2025). Terahertz-based IRS-assisted secure symbiotic radio communication: A DRL approach. IEEE. Recuperado de https://ieeexplore.ieee.org/abstract/document/10872970

Shahwar, N., & Ahmed, F. (2025). Adaptive Beamforming in Indoor 6G Networks Using DDPG-SR Models. Wireless Communications and Mobile Computing, 34(6), 78-90.

Sharma, M. K., Liu, C. F., Farhat, I., & Sehad, N. (2023). UAV immersive video streaming: A comprehensive survey, benchmarking, and open challenges. arXiv. Recuperado de https://arxiv.org/abs/2311.00082.

Sharma, S., Alabdulatif, A., & Akyildiz, I. F. (2024). 6G Communication and IoNT: A Technological Perspective. IEEE Communications Magazine, 62(3), 24-29. https://doi.org/10.1109/MCOM.2024.9876543

Sharma, S., Popli, R., Singh, S., Chhabra, G., Saini, G. S., Singh, M., Sandhu, A., Sharma, A., & Kumar, R. (2024). The Role of 6G Technologies in Advancing Smart City Applications: Opportunities and Challenges. Sustainability, 16(16), 7039. https://doi.org/10.3390/su16167039

Shouman, M., & Yaacoub, E. (2024). Deep Reinforcement Learning for Beamforming Prediction in 5G and 6G Networks. IEEE Communications Letters, 28(5), 903-906. https://doi.org/10.1109/LCOMM.2024.3012548

Shouman, O., & Yaacoub, E. (2024). Beam Prediction in 5G and 6G Systems: A Deep Learning Approach. IEEE Communications. Recuperado de https://ieeexplore.ieee.org/abstract/document/10794369

Sim, M. S., Lim, Y. G., Park, S. H., Dai, L., & Chae, C. B. (2020). Deep learning-based mmWave beam selection for 5G NR/6G with sub-6 GHz channel information: Algorithms and prototype validation. IEEE Access.

Sim, T., Droulias, A., & Theodoridis, N. (2020). Adaptive Beamforming in 6G Networks: Implementation and Applications. University of Macedonia. https://dspace.lib.uom.gr/handle/2159/31818

Sim, T., Kim, H., & Park, S. (2020). Beamforming for mmWave Networks using Deep Q-Learning. IEEE Communications Letters, 24(3), 472-475.

Sizer, T., Samardzija, D., & Viswanathan, H. (2021). Integrated solutions for deployment of 6G mobile networks. IEEE Vehicular Technology.

Sobhi-Givi, H., Lee, J., & Park, M. (2025). Q-Learning-Based Beam Management in mmWave-NOMA Systems. IEEE Transactions on Communications, 71(1), 123-136. https://doi.org/10.1109/TCOMM.2025.3124567

Sobhi-Givi, S., Nouri, M., & Shayesteh, M. G. (2025). Efficient optimization in RIS-assisted UAV system using deep reinforcement learning for mmWave-NOMA 6G communications. IEEE Internet of Things.

Soulpage IT Solutions. (s. f.). Deterministic Policy Gradient (DPG). Recuperado de https://soulpageit.com/ai-glossary/deterministic-policy-gradient-explained/

Shao, Y., Sun, L., Liu, F., Yang, S., Ma, W., & Li, L. (2024). Advanced deep learning models for 6G: overview, opportunities and challenges. IEEE Transactions.

Srinivas, K. K., Kiran, B. S., & Sathvika, T. (2023). An adaptive hybrid beamforming technique for analysis of throughput, blocking probability, transmission power in 5G MIMO mmWave. IEEE Access, 11, 23456-23467. https://ieeexplore.ieee.org/abstract/document/10169422/

Sun, C., Zhang, S., & Xu, Y. (2025). Principal Component Analysis-based Optimal Feature Design for GNSS Spoofing Detection. IEEE Communications Society. Recuperado de https://ieeexplore.ieee.org/abstract/document/10971402

Sun, Y., Kim, J., & Lee, S. (2025). Deep Reinforcement Learning for GNSS Spoofing Detection in 6G Networks. Sensors, 25(2), 134-145.

Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. Disponible en https://epubs.siam.org/doi/pdf/10.1137/21N975254#page=7.

Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. Recuperado de https://epubs.siam.org/doi/pdf/10.1137/21N975254#page=7.

Tariq, M., Khan, Z., & Awan, F. (2024). Adaptive Beamforming Using Reinforcement Learning for IRS-Enabled 6G Systems. IEEE Transactions on Communications, 72(5), 1023-1037. https://doi.org/10.1109/TCOMM.2024.110237

Tech Xplore. (2024, septiembre). Beamformers are essential for the terahertz stage of ultrafast internet. Recuperado de https://techxplore.com/news/2024-09-chip-terahertz-stage-ultrafast-internet.html

Tech Xplore. (2024). Chip terahertz stage for ultrafast internet using AI beamforming. Recuperado de https://techxplore.com/news/2024-09-chip-terahertz-stage-ultrafast-internet.html

Tiang, J. J., Mahmud, A., Chin, C. G. (2023). Deep reinforcement learning-based adaptive beam tracking and resource allocation in 6G vehicular networks with switched beam antennas. Electronics, 12(10), 2294.

Tomkos, I., Christofidis, C., & Uzunidis, D. (2024). The “X-Factor” of 6G Networks: Optical Transport Empowering 6G Innovations. IEEE.

Tomkos, I., Lee, S., & Yamamoto, T. (2024). Optical and Wireless Integration in 6G Networks: A Unified Approach. Journal of Optical Networks, 15(6), 77-85.

Tyagi, A. K., Tiwari, S., Gupta, S., Mishra, A. K. (2025). Next-Generation Air Interfaces for 6G. IEEE Wireless Communications.

Vargemidou, M., & Maximidis, R. (2024). Multi-User 6G Radio Access Networks: THz Fiber Wireless X-Haul of a Multi-Beam Millimeter Wave Antenna. IEEE.

Vardakas, J. S., Soumplis, P., Kokkinos, P. (2025). A Self-driven Virtual Elastic Infrastructure For Cell-free Based 6G Networks. IEEE Wireless Communications.

Wang, J., Zhao, C., Sun, G., Kang, J., & Mao, S. (2025). Generative AI Enabled Robust Data Augmentation for Wireless Sensing in ISAC Networks. arXiv. https://arxiv.org/abs/2502.12622

Wang, J., & Zhang, Y. (2021). Using cloud computing platform of 6G IoT in e-commerce personalized recommendation. International Journal of System Assurance Engineering.

Wang, Q., Zhao, Y., & Sun, T. (2025). Advanced Sensing Capabilities in 6G Networks: A Comprehensive Review. Journal of Network and Systems Management, 32(4), 347-365.

Wang, X., Liu, Y., & Zhang, H. (2024). Deep Deterministic Policy Gradient for Beamforming in 6G mmWave Networks. IEEE Transactions on Wireless Communications, 23(5), 2784-2796.

Wang, Z., Wang, R., Wu, J., & Zhang, W. (2024). Dynamic Resource Allocation for Real-Time Cloud XR Video Transmission: A Reinforcement Learning Approach. IEEE Transactions on Communications, 73(2), 1157-1169. https://mec.tongji.edu.cn/new_web/paper/24-01-1.pdf

Watkins, C. J. C. H., & Dayan, P. (1992). Q-learning. Machine Learning, 8(3-4), 279-292. https://link.springer.com/content/pdf/10.1007/BF00992698.pdf

Wei, L., Lu, H., & Zhao, Q. (2024). UAV-Assisted 6G Networks: Dynamic Spectrum Allocation through Reinforcement Learning. IEEE Transactions on Wireless Communications, 23(5), 182-195.

Wei, M. (2024). Integrated Sensing and Communication: The Core of 6G. Wireless Sensing and Communications, 14(2), 125-138.

Wei, X., Wang, L., Zhang, H., & Jia, L. (2024). AttDet: Attitude Angles-Based UAV GNSS Spoofing Detection. IEEE Communications. Recuperado de https://ieeexplore.ieee.org/abstract/document/10945148/

Wei, Z., Du, R., & Yang, Z. (2024). Integrated Sensing and Communication: Who Benefits More?. ZTE Communications. https://zte.magtechjournal.com/CN/10.12142/ZTECOM.202403006

Wong, E. S., Wahab, N. H. A., Saeed, F., & Alharbi, N. (2022). 360-degree video bandwidth reduction: Technique and approaches comprehensive review. MDPI Applied Sciences. Recuperado de https://www.mdpi.com/2076-3417/12/15/7581.

Y,
Yajnanarayana, V., Rydén, H., & Gustavsson, U. (2020). 5G handover using reinforcement learning. IEEE 5G World Forum. Disponible en: https://arxiv.org/pdf/1904.02572

Yeganeh, R. S., & Behroozi, H. (2025). Energy Efficient RSMA-Based LEO Satellite Communications Assisted by UAV-Mounted BD-Active RIS: A DRL Approach. arXiv. Recuperado de https://arxiv.org/abs/2505.04148

Yu, H., Shokrnezhad, M., Taleb, T., Li, R., & Song, J. S. (2023). Toward 6G-based metaverse: Supporting highly-dynamic deterministic multi-user extended reality services. IEEE Network. Recuperado de https://oulurepo.oulu.fi/bitstream/handle/10024/46169/nbnfi-fe20231116147122.pdf?sequence=1.

Zade, A. E., Haghighi, S. S., & Soltani, M. (2022). Deep neural networks for neuro-oncology: Towards patient individualized design of chemo-radiation therapy for Glioblastoma patients. Journal of Biomedical Informatics. Disponible en: https://www.sciencedirect.com/science/article/pii/S1532046422000223

Zhang, H., Shen, C., Ma, Y., & Liu, D. (2023). Applications of Terahertz Communication in 6G Networks. Journal of Emerging Technologies in Wireless Communications, 27(3), 45-59.

Zhang, H., Shlezinger, N., & Guidi, F. (2023). 6G wireless communications: From far-field beam steering to near-field beam focusing. IEEE Communications Surveys & Tutorials.

Zhang, M., Shen, L., Ma, X., & Liu, J. (2023). AI and 6G into the metaverse: Fundamentals, challenges and future research trends. IEEE Open Journal. Recuperado de https://ieeexplore.ieee.org/abstract/document/10415393/.

Zhang, Y., Mismar, F. B., & Alkhateeb, A. (2020). Deep reinforcement learning for intelligent reflecting surfaces: Towards standalone operation. 2020 IEEE 21st International Workshop on Signal Processing Advances in Wireless Communications (SPAWC), 1-5. https://arxiv.org/pdf/2002.11101

Zhang, Y., Osman, T., & Alkhateeb, A. (2023). Online beam learning with interference nulling for millimeter wave MIMO systems. IEEE Transactions on Wireless Communications, 22(3), 1627-1641. https://arxiv.org/pdf/2209.04509

Zhao, J., Liu, J., Yang, L., Ai, B., & Ni, S. (2021). Future 5G-oriented system for urban rail transit: Opportunities and challenges. China Communications, 18(3), 67-75. https://www.researchgate.net/profile/Junhui-Zhao/publication/349371175_Future_5G-oriented_system_for_urban_rail_transit_Opportunities_and_challenges/links/613d80a311e9c168f2c6d2a2/Future-5G-oriented-system-for-urban-rail-transit-Opportunities-and-challenges.pdf

Zhao, X., Xia, L., Tang, J., & Yin, D. (2019). Deep reinforcement learning for search, recommendation, and online advertising: A survey. ACM SIGWEB Newsletter. Recuperado de https://arxiv.org/pdf/1812.07127.

Zhao, Y., Dai, L., & Zhang, J. (2024). Near-field communications: theories and applications. Frontiers of Information Technology & Electronic Engineering. https://link.springer.com/content/pdf/10.1631/FITEE.2440000.pdf

Zhao, Y., Wang, N., Liu, Z., & Mu, E. (2022). Construction theory for a building intelligent operation and maintenance system based on digital twins and machine learning. Buildings, 12(2), 87. https://www.mdpi.com/2075-5309/12/2/87/pdf

Zhao, Y., Zhai, W., Zhao, J., Zhang, T., & Sun, S. (2022). Multi-agent DQN-based beamforming for industrial networks. arXiv Preprint arXiv:2101.03889. https://arxiv.org/pdf/2101.03889

Zhu, J., Yu, X., & Chen, X. (2023). Adaptive Beam Management using DQN in 6G mmWave Systems. IEEE Transactions on Wireless Communications, 22(3), 1578-1587.

Zhu, M., Li, L., Xia, S., & Chang, T. H. (2023). Information and sensing beamforming optimization for multi-user multi-target MIMO ISAC systems. EURASIP Journal on Advances in Signal Processing, 2023(1), 1-12. https://link.springer.com/content/pdf/10.1186/s13634-023-00972-w

ZTE. (2025). AI-powered beam management for 6G V2X networks. Recuperado de https://www.zte.com.cn

ZTE. (2025). Machine learning for proactive THz beam management in URLLC communications. Recuperado de https://www.zte.com.cn