¡Superando a Gemini y ChatGPT! Evaluación en profundidad de Qwen de Alibaba: gratuita, con referencias, y capaz de generar fuentes de información Alpha en tiempo real con un solo clic

Bitget App

Opera de forma inteligente

MarsBit2025/10/27 02:21

Mostrar el original

Por:Jose Antonio Lanz

La investigación profunda de Qwen de Alibaba ha añadido funciones de generación de páginas web y pódcast con un solo clic. En las pruebas, Qwen y Gemini empatan como los mejores en precisión; Qwen lidera en profundidad de investigación y salida de páginas web, mientras que Gemini destaca en calidad multimedia. Resumen generado por Mars AI. Este resumen ha sido generado por el modelo Mars AI, cuya precisión y exhaustividad todavía están en fase de actualización iterativa.

La investigación profunda de Qwen de Alibaba puede crear páginas web y pódcast en tiempo real en cuestión de segundos

La investigación profunda de Qwen de Alibaba ahora permite, con un solo clic, convertir informes en páginas web y pódcast en tiempo real. A continuación se muestra una comparación de este servicio gratuito con Gemini, ChatGPT y Grok.

Resumen breve

Alibaba ha actualizado Qwen Deep Research, añadiendo funciones de generación de páginas web y pódcast con un solo clic.
En las pruebas, Qwen y Gemini empataron en precisión, ambos superando a ChatGPT y Grok.
En general, Qwen destaca en profundidad de investigación y salida de páginas web compartibles, mientras que Gemini lidera en calidad multimedia.

El equipo de investigación de IA dedicado de Alibaba, Qwen, lanzó la semana pasada una importante actualización de su chatbot de IA, permitiendo a los usuarios generar documentos de investigación completos sobre cualquier tema.

Después, puedes convertir fácilmente estos documentos en páginas web claras o pódcast multirrol con solo unos clics.

Qwen Chat es similar en interfaz y experiencia de usuario a ChatGPT, DeepSeek o Claude, y está disponible gratuitamente en todo el mundo.

Las nuevas funciones se basan en tres modelos de código abierto que trabajan en conjunto: Qwen3-Coder se encarga de analizar la estructura de la página web, Qwen-Image genera gráficos incrustados y Qwen3-TTS impulsa la narración dinámica por voz.

A pesar de basarse en modelos de código abierto, toda la experiencia de extremo a extremo —incluyendo la ejecución de la investigación, el despliegue web y la generación de audio— es operada por Qwen como un servicio gestionado.

El flujo de trabajo comienza en la interfaz de Qwen Chat, donde el usuario plantea una pregunta de investigación. Tras una clarificación inicial, la IA realiza una búsqueda en la web, analiza fuentes de datos públicas y finalmente genera un informe completo con citas.

A continuación, aparecen dos nuevas opciones: "Desarrollo web" genera automáticamente una página web dinámica de nivel profesional, desplegada y alojada por Qwen, e incluye gráficos incrustados.

La opción "Pódcast" ofrece una discusión de audio con narración dinámica multirrol, con 17 voces principales y 7 voces secundarias a elegir.

Pruebas de modelos

Para evaluar el desempeño de Qwen como herramienta de investigación, ejecutamos la misma consulta de investigación compleja en Qwen, Gemini, ChatGPT y Grok. La tarea requería analizar argumentos filosóficos y científicos sobre la existencia de Dios (el contenido específico puede consultarse en el repositorio de GitHub), y cada modelo debía generar un informe de investigación completo. La evaluación incluyó cinco criterios: precisión de los argumentos y citas, exhaustividad de la información, claridad de la exposición, profundidad del pensamiento y calidad general.

Resumen: Qwen Deep Research sobresale en profundidad de análisis, citas bibliográficas y la función exclusiva de generación automática de páginas web, lo que lo convierte en la opción ideal para académicos y creadores. También es la mejor alternativa gratuita todo en uno para investigadores. Sin embargo, Gemini sigue liderando en calidad de audio y video, ChatGPT y Grok son adecuados para uso diario, pero el primero carece de la amplitud de Qwen y el segundo no alcanza el nivel de calidad de Google.

Evaluación detallada:

Precisión: ¿Se expresan correctamente las posturas filosóficas y científicas y se citan las fuentes de manera adecuada?

Qwen capta los detalles con precisión. Al discutir el argumento cosmológico, cita correctamente recursos académicos como "Por qué no soy cristiano" de Bertrand Russell y el debate específico entre William Lane Craig y Peter Atkins. A diferencia de otras herramientas de investigación de IA como Perplexity y Grok, la mayoría de sus fuentes provienen de instituciones académicas autorizadas (como Stanford, Princeton, Oxford y Drew University), llegando a veces a documentos originales, e incorporando análisis relevantes de Quora y Facebook cuando es oportuno.

Gemini logra la misma precisión con 94 citas numeradas (algunas repetidas en diferentes secciones del informe).

Ambos distinguen correctamente los conceptos, sin confundir el fundamentalismo bíblico con el teísmo general.

ChatGPT depende excesivamente de la Stanford Encyclopedia of Philosophy y tiende a simplificar en exceso. Grok puede ofrecer resúmenes precisos, pero la atribución es ambigua, usando expresiones generales como "remontándose a Platón y Aristóteles".

Resultado: Qwen y Gemini empatan como los mejores.

Exhaustividad de la información: ¿Qué tan detallada es la investigación?

Qwen es el único modelo que establece un capítulo específico sobre "Crítica al ateísmo: carga de la prueba y naturaleza de la evidencia", explorando dimensiones del debate que otras herramientas no abordan. Distingue claramente entre "ateísmo débil" (duda sobre la afirmación de Dios) y "ateísmo fuerte" (afirma que Dios no existe), citando el estándar de "más allá de la duda razonable" propuesto por pensadores ateos como Gary Wittenberger.

A continuación, un ejemplo de contenido generado por Qwen: "Una de las cuestiones más controvertidas es la carga de la prueba. Bertrand Russell ilustró este punto con su famosa analogía de la tetera: así como no puede probar que no existe una pequeña tetera orbitando el sol entre la Tierra y Marte, considera que los teístas tampoco pueden probar que Dios existe realmente."

Ningún otro modelo explora tan a fondo el debate sobre la carga de la prueba, ya que puede no ser un tema central. Gemini se acerca a esta profundidad cubriendo en detalle el argumento de la conciencia y la crítica del "vacío teológico". ChatGPT incluye argumentos pragmáticos como la apuesta de Pascal y explora el impacto real en la ética y la política. Grok es más conciso (alrededor de un tercio de la extensión del informe de Qwen), pero añade tablas de resumen útiles.

Resultado: Qwen es el más exhaustivo.

Claridad: ¿Cómo se presenta el contenido de la investigación?

Grok utiliza tablas concisas para organizar los argumentos por tipo (argumentos filosóficos vs científicos, a favor vs en contra). Sus capítulos están claramente divididos: "Argumentos filosóficos", "Argumentos científicos", "Detalles inesperados", permitiendo una revisión rápida para cualquier persona.

ChatGPT utiliza muchas explicaciones entre paréntesis para facilitar la comprensión de conceptos complejos. Por ejemplo: "Si la existencia de Dios es posible (es decir, lógicamente coherente), entonces Dios debe existir." El "(es decir, lógicamente coherente)" ayuda a los lectores sin formación filosófica.

Qwen y Gemini tienen un estilo más académico. Qwen organiza el contenido con títulos formales como "Argumentos teístas: fundamentos cosmológicos y teleológicos", lo que, aunque preciso, puede dificultar la lectura. Gemini utiliza numeración romana (I. Introducción, II. Argumentos filosóficos), con una estructura clara pero que requiere una lectura cuidadosa.

Ambos están dirigidos a investigadores rigurosos, mientras que ChatGPT y Grok apuntan a un público más amplio.

Resultado: ChatGPT presenta la información con mayor claridad, seguido de Grok.

Diversidad de fuentes: ¿La investigación abarca diversas tradiciones, disciplinas y perspectivas?

Qwen fusiona la filosofía técnica (argumento Kalam, principio de razón suficiente, lógica modal S5) con debates científicos de vanguardia (singularidad del Big Bang, fluctuaciones cuánticas, función del ADN). Garantiza la comprensión mediante explicaciones concretas y proporciona ejemplos de contexto para posturas y argumentos.

Por ejemplo, al explicar los argumentos teístas, Qwen construye tablas que enumeran claramente los supuestos centrales, las críticas y los académicos que los apoyan.

Gemini alcanza un nivel similar cubriendo el argumento de la conciencia, que la mayoría de los modelos ignoran, y advierte de manera más explícita sobre las deficiencias de razonamiento del "vacío teológico".

ChatGPT aporta un valor único con su extenso capítulo sobre "impacto real", explorando cómo este debate afecta la política educativa científica, la legislación bioética y las actitudes individuales ante la muerte. Esta sección es menos académica pero más pragmática, y sigue siendo relevante para comprender la esencia de la investigación.

Grok cubre los principales argumentos pero carece de detalles, mencionando el ajuste fino y el principio antrópico sin citar cifras concretas ni profundizar.

Resultado: Qwen y Gemini son los mejores.

Calidad general: Considerando rigor, coherencia y valor académico, ¿cuál investigación citaría?

Los informes generados por Qwen y Gemini alcanzan un nivel apto para ser presentados a un tutor académico. La ventaja única de Qwen es el equilibrio en la profundidad de los argumentos teístas y las críticas ateas, incluyendo el capítulo sobre la carga de la prueba. El punto fuerte de Gemini es la integración de la vanguardia científica (conciencia, evolución, cosmología) con argumentos filosóficos.

ChatGPT tiene un notable valor didáctico —ideal para la enseñanza o para comprender el impacto real. Grok puede servir como guía introductoria fiable o referencia rápida.

En otras palabras, si solo desea obtener conocimientos rápidamente para una conversación, impresionar en una cita o refrescar la memoria antes de una presentación sobre un tema conocido, ChatGPT y Grok pueden ser más adecuados.

Puntuación final:

Qwen: 9/10

Gemini: 9/10

ChatGPT: 8/10

Grok: 6/10

Duelo de funciones de pódcast: Qwen contra Gemini

La función de pódcast de Qwen lo pone en competencia directa con Google NotebookLM y Gemini, pioneros en resúmenes de audio generados por IA.

A diferencia de Gemini, Qwen ofrece una amplia selección de voces de presentador. Su estructura es sólida: dos presentadores de IA mantienen una conversación real sobre su investigación, en lugar de simplemente convertir texto en voz.

Pero la calidad del audio es inconsistente: algunas voces suenan naturales, pero la mayoría tienen un tono robótico rígido y acentos extraños. Durante las pruebas, un presentador masculino expresó "oh oh oh" repetidamente por estar "profundamente conmovido", lo que llevó a mi esposa a preguntarse si estaba viendo contenido para adultos.

Con prueba y error se pueden encontrar voces aceptables, y la calidad mejora notablemente.

Sin embargo, Gemini y NotebookLM superan ampliamente a Qwen en este campo. La función de resumen de audio de Google (introducida en NotebookLM en septiembre de 2024 y expandida a Gemini en marzo de 2025) muestra un asombroso nivel de naturalidad humana, con patrones de voz naturales, diálogos de confrontación e incluso elementos de humor.

El pódcast de Gemini es más humano y atractivo.

La plataforma también ofrece funciones de generación de video, lo que supone una ventaja significativa para los usuarios que prefieren comprender los temas a través de medios audiovisuales en lugar de leer textos largos.

Qwen no puede realizar esta función —de hecho, ningún otro modelo lo permite.

Si necesita una solución multimedia completa que incluya audio, video y páginas web, Gemini es actualmente la opción más completa.

Ventaja en la generación de páginas web

Además de la calidad de la investigación, la gran baza de Qwen es la función de generación automática de páginas web, algo que ningún otro modelo ofrece.

Tras completar la investigación, puede convertirla en un sitio web alojado en tiempo real. No es un PDF ni un documento de Google, sino una página web real con títulos, tablas formateadas y citas con hipervínculos incrustados.

La interfaz de usuario es muy similar a Kimi, con una maquetación clara, diseño responsivo y soporte para compartir al instante.

Los usuarios de ChatGPT deben copiar y pegar manualmente en un constructor de sitios web.

Gemini mantiene el contenido en Docs. Grok solo produce texto. Solo Qwen puede generar automáticamente resultados listos para la web.

Esta ventaja en el flujo de trabajo es realmente un valor añadido.

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!

También te puede gustar

Pieverse lanzará el protocolo x402b, que soporta pagos sin gas en BNB Chain y recibos conformes

Cointime•2025/10/27 05:26

4E: El suministro ilíquido decreciente de Bitcoin podría suprimir el repunte de precios

Cointime•2025/10/27 05:25

Análisis en profundidad de Talus: ¿Cómo la fuerza laboral digital está cambiando nuestra forma de trabajar?

Explorar cómo Talus construye un sistema económico digital autónomo a través de una infraestructura de confianza basada en blockchain para agentes de inteligencia artificial.

深潮•2025/10/27 05:20

Análisis en profundidad de Talus: ¿Cómo la fuerza laboral digital está cambiando nuestra forma de trabajar?

Entrevista con el fundador de ETHGas: una experiencia sin Gas será la puerta de entrada para los próximos mil millones de usuarios; “recompensas + cobertura” es nuestra estrategia en dos pasos.

El proyecto ETHGas tiene como objetivo construir un mercado financiero de espacio de bloques para lograr un “futuro sin Gas” en Ethereum.

深潮•2025/10/27 05:20