Bitget App
Opera de forma inteligente
Comprar criptoMercadosTradingFuturosEarnCentralMás
Las “tres grandes predicciones sobre los AI Agents en 2026” de a16z: la desaparición de los cuadros de entrada, la prioridad en el uso de agentes y el auge de los agentes de voz.

Las “tres grandes predicciones sobre los AI Agents en 2026” de a16z: la desaparición de los cuadros de entrada, la prioridad en el uso de agentes y el auge de los agentes de voz.

行业观察行业观察2025/12/23 06:06
Show original
By:行业观察
a16z predice que la IA está evolucionando de una herramienta pasiva a un agente activo.


Autor: Long Yue

Fuente: Wallstreetcn


En el reciente seminario en línea "Big Ideas for 2026" organizado por la reconocida firma de capital de riesgo Andreessen Horowitz (A16z), su equipo de socios trazó un claro mapa de la evolución de la tecnología de IA: la inteligencia artificial está pasando de ser una herramienta de chat que espera instrucciones a convertirse en un "agente" capaz de ejecutar tareas de manera proactiva.


Al mismo tiempo, propusieron "tres grandes conjeturas" que remodelarán la industria: la interacción de la interfaz de usuario pasará de "prompts" a "ejecución", el diseño de productos cambiará de "centrado en el ser humano" a "prioridad para agentes", y los agentes de voz pasarán de demostraciones técnicas a implementaciones a gran escala.


Conjetura uno: la desaparición del cuadro de entrada.


Marc Andrusko, socio del equipo de inversión en aplicaciones de IA de a16z, predice audazmente: "Para 2026, el cuadro de entrada como interfaz principal de usuario de las aplicaciones de IA desaparecerá". Él cree que la próxima generación de aplicaciones de IA ya no requerirá que los usuarios introduzcan instrucciones de manera tediosa, sino que observarán el comportamiento del usuario, intervendrán proactivamente y proporcionarán planes de acción para su revisión.


Detrás de este cambio se encuentra un gran salto en el valor comercial de la IA. Andrusko señala: "Antes nos enfocábamos en el gasto global en software de 300 a 400 mil millones de dólares al año, pero ahora nos entusiasma el gasto laboral de 13 trillones de dólares solo en Estados Unidos. Esto amplía la oportunidad de mercado del software unas 30 veces".


Él compara a los futuros agentes de IA con los empleados "nivel S" más destacados: "Los empleados con la mayor proactividad identifican problemas, diagnostican la causa raíz, implementan soluciones y solo al final te dicen: 'Por favor, aprueba la solución que encontré'. Ese es el futuro de las aplicaciones de IA".



Las “tres grandes predicciones sobre los AI Agents en 2026” de a16z: la desaparición de los cuadros de entrada, la prioridad en el uso de agentes y el auge de los agentes de voz. image 0


Las “tres grandes predicciones sobre los AI Agents en 2026” de a16z: la desaparición de los cuadros de entrada, la prioridad en el uso de agentes y el auge de los agentes de voz. image 1


Conjetura dos: "Prioridad de uso para agentes" y legibilidad para máquinas.


Stephanie Zhang, socia de inversión en crecimiento de a16z, propuso una lógica de diseño disruptiva: el software ya no se diseñará para los ojos humanos. Ella señala: "Lo que es importante para el consumo humano puede no serlo para el consumo de agentes. La nueva dirección de optimización no es la jerarquía visual, sino la legibilidad para máquinas (Machine Legibility)".


En opinión de Stephanie, los principios "5W1H" o las interfaces de usuario pulidas que optimizábamos para captar la atención humana en el pasado serán reconstruidos en la era de los agentes. Ella predice: "Probablemente veremos una gran cantidad de contenido ultra personalizado y de alta frecuencia generado para el interés de los agentes, como si fueran palabras clave en la era de los agentes".


Este cambio influirá profundamente en todos los aspectos, desde la creación de contenido hasta el diseño de software.


Las “tres grandes predicciones sobre los AI Agents en 2026” de a16z: la desaparición de los cuadros de entrada, la prioridad en el uso de agentes y el auge de los agentes de voz. image 2


Conjetura tres: el auge de los agentes de voz.


Mientras tanto, Olivia Moore, socia del equipo de inversión en aplicaciones de IA de a16z, observa que "los agentes de voz de IA están comenzando a ganar terreno". Ella afirma que los agentes de voz han pasado de ser un concepto de ciencia ficción a sistemas que las empresas reales están comprando e implementando a gran escala. Especialmente en sectores como la atención médica, la banca y las finanzas, y la contratación, los agentes de voz son muy valorados por su alta fiabilidad, fuerte cumplimiento normativo y capacidad para resolver la escasez de mano de obra.


Compartió un hallazgo interesante: "En el sector bancario y de servicios financieros, la IA de voz en realidad funciona mejor, porque los humanos son muy buenos incumpliendo las regulaciones, mientras que la IA de voz puede ejecutarlas con precisión cada vez".


Moore enfatiza: "La IA no te quitará el trabajo, pero una persona que use IA sí lo hará". Esto indica que los centros de llamadas tradicionales y la industria BPO enfrentarán una profunda transformación, y los proveedores de servicios que puedan utilizar la tecnología de IA para ofrecer precios más bajos o mayor capacidad de procesamiento obtendrán una ventaja competitiva.


Las “tres grandes predicciones sobre los AI Agents en 2026” de a16z: la desaparición de los cuadros de entrada, la prioridad en el uso de agentes y el auge de los agentes de voz. image 3


Puntos clave del seminario en línea:


  • El fin de la UI: la era del cuadro de prompt como interfaz principal de interacción está llegando a su fin, la IA pasará de "respuesta pasiva" a "observación e intervención proactiva".
  • Incremento de mercado de 30 veces: el mercado objetivo de la IA está cambiando de un gasto en software de 400 mil millones de dólares a un gasto laboral de 13 trillones de dólares, lo que supone un salto fundamental en la lógica comercial.
  • Modelo de empleado nivel S: la IA ideal debe ser como un empleado altamente proactivo: detectar problemas, diagnosticar causas, proponer soluciones y ejecutarlas, dejando solo la confirmación final al ser humano.
  • Legibilidad para máquinas (Machine Legibility): el objetivo del diseño de software está pasando de "prioridad humana" a "prioridad para agentes", la UI visual dejará de ser el núcleo.
  • Alienación de la creación de contenido: la competencia de marca pasará de atraer la atención humana a "optimización para motores generadores" (GEO), e incluso podría surgir una gran cantidad de "contenido de alta frecuencia" generado para la captura por IA.
  • Ventaja de cumplimiento de la IA de voz: en industrias de alto umbral como las finanzas, la IA de voz supera a los humanos porque puede cumplir el 100% de los requisitos normativos y su trayectoria es rastreable.
  • Penetración en salud y administración pública: los agentes de voz están resolviendo el problema de alta rotación en la industria médica y se espera que en el futuro aborden puntos críticos en servicios públicos como llamadas al 911 y el DMV.
  • Industrialización de la IA de voz: la IA de voz está evolucionando hacia una industria completa en lugar de un solo mercado, habrá ganadores en cada capa de la cadena de valor, desde modelos base hasta aplicaciones de plataforma.
  • De herramienta a "empleado de IA": la IA ya no es solo una herramienta auxiliar, sino un empleado digital capaz de manejar de forma independiente un ciclo de negocio completo.


Transcripción completa del seminario del equipo de IA de a16z (traducido por herramientas de IA):


Director 00:00 Bienvenidos a "Big Ideas for 2026". Escucharemos a Marc Andrusko hablar sobre la evolución de la interfaz de usuario de la IA y el cambio fundamental en la forma en que interactuamos con los sistemas inteligentes. Stephanie Zhang discutirá el significado de diseñar para agentes en lugar de para humanos, una transformación que está remodelando el desarrollo de productos. Olivia Moore compartirá su visión sobre el auge de los agentes de voz de IA y su creciente papel en nuestra vida diaria. Estas no son solo predicciones, son ideas de personas que trabajan directamente con los fundadores y empresas que están construyendo el mundo del futuro.


Marc Andrusko 00:31 Soy Marc Andrusko, socio del equipo de inversión en aplicaciones de IA. Mi gran idea para 2026 es la desaparición del cuadro de entrada como interfaz principal de usuario de las aplicaciones de IA. La próxima ola de aplicaciones requerirá muchos menos prompts. Observarán lo que haces e intervendrán proactivamente, proporcionando planes de acción para que los revises.


Marc Andrusko 00:49 La oportunidad que estamos atacando antes era el gasto global anual en software de 300 a 400 mil millones de dólares. Ahora nos entusiasma el gasto laboral de 13 trillones de dólares solo en Estados Unidos. Esto amplía la oportunidad de mercado del software o el TAM (mercado total direccionable) unas 30 veces. Si partes de aquí y piensas, bueno, si todos queremos que este software trabaje para nosotros, idealmente, su capacidad de trabajo debería ser al menos igual a la humana, si no mejor, ¿verdad? Así que me gusta pensar, hmm, ¿cómo trabajan los mejores empleados? ¿Cómo trabajan los mejores empleados humanos? Recientemente he estado discutiendo un gráfico que circula en Twitter. Es una pirámide sobre cinco tipos de empleados y por qué los más proactivos son los mejores. Si empiezas desde la base de la pirámide, ahí están las personas que detectan un problema y vienen a ti para pedir ayuda, preguntando qué hacer. Esos son los empleados con menor proactividad.


Pero si llegas al nivel S, es decir, los empleados con la mayor proactividad que puedes tener, detectan un problema, investigan lo necesario para diagnosticar la causa, estudian varias soluciones posibles, implementan una de ellas y te mantienen informado, o vienen a ti en el último momento para decirte: "Por favor, aprueba la solución que encontré". Creo que así serán las aplicaciones de IA del futuro. Y creo que eso es lo que todos queremos. Es hacia donde todos estamos trabajando. Así que tengo mucha confianza en que estamos cerca de lograrlo. Creo que los modelos de lenguaje grandes (LLM) siguen mejorando, siendo más rápidos y baratos, y creo que, en cierto modo, el comportamiento del usuario aún requerirá la participación humana en la última etapa para aprobar cosas, especialmente en escenarios de alto riesgo. Pero creo que los modelos son perfectamente capaces de proponer sugerencias muy inteligentes en tu nombre, y básicamente solo necesitas hacer clic para confirmar.


Marc Andrusko 02:27 Como saben, estoy muy fascinado por el concepto de CRM nativo de IA. Creo que es un ejemplo perfecto que muestra cómo podrían ser estas aplicaciones proactivas. En el mundo actual, un vendedor podría abrir su CRM, revisar todas las oportunidades abiertas, ver el calendario del día y pensar, bueno, ¿qué acción puedo tomar ahora para tener el mayor impacto en mi embudo de ventas y mi capacidad de cierre? Para el CRM del futuro, tu agente de IA o CRM de IA debería estar haciendo todo esto continuamente por ti, no solo identificando las oportunidades más obvias en tu canal, sino también revisando tus correos electrónicos de los últimos dos años para encontrar, ya sabes, ese lead que alguna vez fue prometedor pero que dejaste de lado. Tal vez deberíamos enviarles este correo y volver a incluirlos en tu proceso, ¿verdad? Así que creo que hay oportunidades infinitas para redactar correos, organizar calendarios, revisar registros de llamadas antiguas, etc.


Marc Andrusko 03:22 Los usuarios comunes aún querrán esa aprobación de la última milla. En casi el 100% de los casos, querrán que la parte humana "en el circuito" sea el decisor final. Y eso está bien.


Marc Andrusko 03:33 Creo que así es como evoluciona naturalmente. Puedo imaginar un mundo en el que los usuarios avanzados dediquen mucho esfuerzo adicional a entrenar cualquier aplicación de IA que usen para que conozca tanto como sea posible sobre su comportamiento y forma de trabajar. Estas aplicaciones aprovecharán ventanas de contexto más grandes y la función de memoria que ya está incorporada en muchos modelos de lenguaje grandes, permitiendo a los usuarios avanzados confiar realmente en que la aplicación complete el 99,9% o incluso el 100% del trabajo. Se sentirán orgullosos de la cantidad de tareas que pueden completar sin aprobación humana.


Stephanie Zhang 04:09 Hola, soy Stephanie Zhang, socia de inversión del equipo de crecimiento de a16z. Mi gran idea para 2026 es: crear para agentes, no para humanos. Una de las cosas que más me entusiasma de 2026 es que la gente tendrá que empezar a cambiar su forma de crear. Esto abarca desde la creación de contenido hasta el diseño de aplicaciones. La gente empezará a interactuar con sistemas como la web o aplicaciones a través de agentes como intermediarios. Lo que es importante para el consumo humano será diferente para el consumo de agentes.


Stephanie Zhang 04:41 Cuando estaba en la secundaria, tomé una clase de periodismo. En esa clase, aprendimos la importancia de comenzar el primer párrafo de un artículo con las 5W y 1H (quién, cuándo, dónde, qué, por qué, cómo), y de empezar los reportajes con una introducción. ¿Por qué? Para captar la atención humana, ya que los humanos pueden perderse declaraciones profundas y perspicaces enterradas en la página H5, pero los agentes no lo harán.


Stephanie Zhang 05:02 Durante años, hemos optimizado para el comportamiento humano predecible. ¿Quieres ser uno de los primeros resultados de búsqueda en Google? ¿Quieres ser uno de los primeros productos listados en Amazon? Esta optimización no solo se aplica a la web, sino también al diseño de software. Las aplicaciones están diseñadas para los ojos y los clics humanos. Los diseñadores optimizan para una buena interfaz de usuario (UI) y flujos intuitivos. Pero a medida que crece el uso de agentes, el diseño visual será menos importante para la comprensión general. Antes, cuando ocurría un incidente, los ingenieros entraban en su panel de Grafana para tratar de reconstruir lo que había pasado. Ahora, los SRE de IA (ingenieros de confiabilidad de sitios) reciben datos de telemetría. Analizan esos datos y reportan hipótesis e ideas directamente en Slack para que los humanos las lean.


Antes, los equipos de ventas tenían que hacer clic y navegar por CRM como Salesforce para recopilar información. Ahora, los agentes obtienen esos datos y resumen las ideas para ellos. Ya no diseñamos para humanos, sino para agentes. El nuevo estándar de optimización no es la jerarquía visual, sino la legibilidad para máquinas. Esto cambiará la forma en que creamos y las herramientas que usamos. ¿Qué buscan los agentes? Es una pregunta para la que no tenemos respuesta. Pero lo que sí sabemos es que los agentes leen todo el texto de un artículo mucho mejor que los humanos, que solo leen los primeros párrafos. Hay muchas herramientas en el mercado, diferentes organizaciones las usan para asegurarse de que cuando los consumidores pregunten a ChatGPT por la mejor tarjeta de crédito empresarial o los mejores zapatos, aparezcan. Así que hay muchas herramientas que llamamos SEO (nota: debería ser SEO o un concepto similar, aquí es una transliteración), que la gente está usando, pero todos se hacen una pregunta: ¿qué quieren ver los agentes de IA?


Stephanie Zhang 06:43 Me gusta esta pregunta sobre cuándo los humanos podrían salir completamente del circuito. Ya hemos visto que esto está ocurriendo en algunos casos. Nuestra empresa del portafolio, Dekagon, ya responde preguntas de forma autónoma para muchos de sus clientes. Pero en otros casos, como operaciones de seguridad o resolución de incidentes, solemos ver más humanos en el circuito, los agentes de IA primero intentan identificar el problema, analizarlo y proporcionar diferentes escenarios potenciales a los humanos. Estos suelen ser casos de mayor responsabilidad y análisis más complejo, y vemos que los humanos permanecen en el circuito. Y hasta que los modelos y la tecnología alcancen una precisión extremadamente alta, probablemente permanecerán más tiempo en el circuito.


Stephanie Zhang 07:33 No sé si los agentes verán Instagram Reels. Es muy interesante, al menos técnicamente, optimizar la legibilidad para máquinas, la perspicacia y la relevancia es realmente importante, especialmente en comparación con el pasado, donde nos enfocábamos más en atraer la atención con trucos llamativos. Lo que ya hemos visto son muchos casos de contenido ultra personalizado; tal vez no creas un artículo extremadamente relevante y perspicaz, sino mucho contenido de baja calidad dirigido a diferentes cosas que crees que los agentes podrían querer ver. Esto es casi como las palabras clave de la era de los agentes, el costo de crear contenido tiende a cero y crear mucho contenido se vuelve muy fácil. Ese es el riesgo potencial de crear mucho contenido para intentar captar la atención de los agentes.


Olivia Moore 08:48 Soy Olivia Moore, socia del equipo de inversión en aplicaciones de IA. Mi gran idea para 2026 es que los agentes de voz de IA comenzarán a ganar terreno. En 2025, vimos que los agentes de voz pasaron de ser algo que parecía ciencia ficción a convertirse en sistemas que las empresas reales están comprando e implementando a gran escala. Me alegra ver que las plataformas de agentes de voz se expanden, trabajan entre plataformas y modos para manejar tareas completas, acercándonos a la verdadera visión de un empleado de IA. Ya hemos visto que casi todos los sectores verticales tienen clientes empresariales que están probando agentes de voz, si no los están implementando ya a gran escala.


Olivia Moore 09:25 La atención médica probablemente sea el mayor aquí. Vemos agentes de voz en casi todas las partes de la cadena de atención médica, incluidas llamadas a aseguradoras, farmacias, proveedores, y también llamadas orientadas al paciente, que pueden ser funciones básicas como programación y recordatorios, pero también llamadas más sensibles como seguimientos postoperatorios o incluso llamadas iniciales de psiquiatría, todas manejadas por IA de voz. Honestamente, creo que uno de los principales impulsores aquí es la alta rotación de personal y la dificultad de contratación en la industria de la salud, lo que hace que los agentes de voz que pueden ejecutar tareas con cierta fiabilidad sean una solución bastante buena. Otra categoría similar es la banca y los servicios financieros. Podrías pensar que hay demasiada regulación y cumplimiento para que la IA de voz funcione allí. Pero resulta que es un área donde la IA de voz realmente funciona mejor, porque los humanos son muy buenos incumpliendo las regulaciones, mientras que la IA de voz puede hacerlo cada vez. Y lo importante es que puedes rastrear el rendimiento de la IA de voz a lo largo del tiempo. Por último, quiero mencionar otro campo donde la tecnología de voz ha logrado avances: la contratación. Esto abarca desde trabajos de primera línea en el comercio minorista hasta puestos de ingeniería de nivel inicial e incluso puestos de consultoría de nivel medio. Con la IA de voz, puedes crear una experiencia para los candidatos en la que pueden entrevistarse inmediatamente en cualquier momento que les convenga y luego pasar al resto del proceso de contratación humano.


Olivia Moore 10:46 A medida que los modelos base mejoran, este año hemos visto grandes avances en precisión y latencia. De hecho, en algunos casos, he oído que algunas empresas de agentes de voz ralentizan deliberadamente sus agentes o introducen ruido de fondo para que suenen más humanos. Cuando se trata de BPO (externalización de procesos de negocio) y centros de llamadas, creo que algunos experimentarán una transición más suave, mientras que otros, ante la amenaza de la IA, especialmente la IA de voz, podrían enfrentar un precipicio más pronunciado. Es como dicen, la IA no te quitará el trabajo, pero una persona que use IA sí lo hará.


Olivia Moore 11:16 Lo que vemos es que muchos clientes finales aún solo quieren comprar soluciones, no tecnología que tengan que implementar ellos mismos. Por lo tanto, a corto y mediano plazo, probablemente seguirán utilizando centros de llamadas o BPO. Pero pueden elegir uno que ofrezca precios más bajos o pueda manejar más volumen porque utiliza IA. Curiosamente, en algunas regiones, por empleado permanente, los humanos todavía son más baratos que la mejor IA de voz. Así que, a medida que los modelos mejoren, si los costos bajarán allí y si los centros de llamadas en esos mercados enfrentarán una amenaza mayor que ahora, será interesante de observar.


Olivia Moore 11:50 La IA es realmente buena en conversaciones multilingües y con acentos fuertes. Muchas veces, en una reunión, puede que no entienda una palabra o frase, y luego reviso mi transcripción de (Granola) y está perfectamente registrada. Así que creo que este es un buen ejemplo de lo que la mayoría de los proveedores de ASR o de voz a texto pueden hacer.


Olivia Moore 12:08 Ahora hay algunos casos de uso que espero ver más el próximo año, cualquiera relacionado con el gobierno. Somos inversores en Prepared 911; si puedes manejar llamadas al 911 (ellos manejan llamadas no urgentes), pero si puedes manejar eso con IA de voz, también deberías poder manejar llamadas al DMV y cualquier otra llamada relacionada con el gobierno, que ahora son muy frustrantes para los consumidores y también para los empleados al otro lado del teléfono.


Olivia Moore 12:32 También me gustaría ver más IA de voz para consumidores. Hasta ahora, ha sido principalmente B2B porque es tan obvio reemplazar o complementar a los humanos en el teléfono con IA mucho más barata. En el ámbito de la voz para consumidores, una categoría que me entusiasma es la relacionada con la salud y el bienestar en general. Ya hemos visto surgir compañeros de voz en residencias asistidas y hogares de ancianos, tanto como compañeros de los residentes como para rastrear diferentes indicadores de salud a lo largo del tiempo. Vemos la IA de voz como una industria, no solo un mercado, lo que significa que habrá ganadores en cada capa de la pila tecnológica. Si te interesa la IA de voz o quieres emprender en ese campo, te sugiero que eches un vistazo a esos modelos. Hay muchas plataformas excelentes, como 11 Labs, donde puedes probar a crear tu propia voz y tu propio agente de voz. Tendrás una buena idea de lo que es posible y de lo que sucederá en el futuro.

0
0

Disclaimer: The content of this article solely reflects the author's opinion and does not represent the platform in any capacity. This article is not intended to serve as a reference for making investment decisions.

PoolX: Haz staking y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!
© 2025 Bitget