El nuevo método de Google hace que los LLM sean más rápidos y potentes, y también más económicos

Google Research propone un nuevo método: las cascadas especulativas

Google Research ha presentado un enfoque híbrido llamado cascadas especulativas, que combina lo mejor de ambos métodos. La clave está en una regla flexible que decide dinámicamente si aceptar los tokens del modelo pequeño o delegarlos al grande. Esto evita los cuellos de botella de las cascadas y el rechazo estricto de la decodificación especulativa, permitiendo respuestas más rápidas y eficientes.

En pruebas con modelos como Gemma y T5, aplicados a tareas de resumen, razonamiento y codificación, las cascadas especulativas demostraron un equilibrio superior entre costes y calidad. Superaron a los métodos tradicionales en velocidad y eficiencia, aunque aún se encuentran en fase experimental. Si los resultados se mantienen, podrían implementarse para mejorar la experiencia de los usuarios sin aumentar los costos.

Por ahora, el equipo de Google sigue refinando el método. Los experimentos sugieren que, al permitir cierta flexibilidad en la validación de respuestas, se logran aceleraciones significativas sin sacrificar precisión. Esto podría ser un paso clave para hacer que los LLM sean más accesibles y rápidos en el futuro.

Fuente Original

Jose Ángel

Jose Angel es uno de los fundadores de Generación Xbox, Universo Samsung y Reflotes. Lleva desde el 2014 administrando todas las webs del grupo y cuenta con una amplia experiencia en el sector de los videojuegos y ha aportado fuentes exclusivas a la web. También ha entrevistado a numerosas personalidades del sector del mundo del videojuego. Jose Angel ha analizado más de 250 juegos, y suele calificar con una nota media de 75 sobre 100 según Open Critic. Además escribe y administra en Universo Samsung.

Jose Ángel

Subscribete

0 Comentarios

Nuevos Más votados

Inline Feedbacks

Ver todos los comentarios

El nuevo método de Google hace que los LLM sean más rápidos y potentes, y también más económicos

Lo más destacado:

Google Research propone un nuevo método: las cascadas especulativas

Jose Ángel

Jose Ángel

Última hora:

Por si había dudas, la ROG Xbox Ally y Ally X no son aptas para todos los bolsillos, estos son los precios finales

Microsoft cambia la manera en la que funciona el botón del mando de Xbox en Windows 11

Microsoft actualiza políticas de la Microsoft Store: nuevas normas para seguridad infantil y contenido de IA

Traducción en Vivo de Apple Intelligence: La función exclusiva para AirPods Pro 3 que no llega a Europa por el RGPD

WhatsApp implementa hilos de respuestas en Android para organizar chats grupales

Apple ofrecerá una mejora de batería para el iPhone 17 Pro en países selectos

Síguenos en redes