Gemini da un Golpe en la Mesa: La IA de Google Ahora Entiende tus Videos


Durante 2023 y principios de 2024, Google parecía estar un paso por detrás de competidores como Microsoft y OpenAI en la carrera de la inteligencia artificial para el consumidor. Sin embargo, ese panorama está cambiando rápidamente, y Gemini se está posicionando como un fuerte contendiente, especialmente después de las revelaciones del último Google I/O en mayo.

Un Salto Cualitativo en Multimodalidad: Gemini Procesa Videos

La gran novedad, aunque no ha sido anunciada oficialmente por Google, ha sido detectada por 9to5Google: Gemini ahora puede procesar videos subidos por el usuario. Esto representa un avance significativo en la multimodalidad de las IA, permitiéndole aceptar y analizar diferentes formatos de datos para generar respuestas. En las pruebas realizadas, el chatbot no solo proporcionó descripciones detalladas de los videos, sino que también los mostró dentro de un reproductor junto con la respuesta.

Esta capacidad de analizar videos supera lo que actualmente ofrecen chatbots como ChatGPT y Copilot, que probablemente no tardarán en ponerse al día. Sin embargo, surge una nueva e importante pregunta sobre la propiedad intelectual y las IA generativas, dado que la plataforma utiliza el contenido subido para su entrenamiento.

Un Despliegue Estratégico y Gradual

La razón por la que Google no ha hecho un anuncio formal parece ser que la función aún no está disponible de forma generalizada. Su implementación varía según las cuentas y los dispositivos, y aunque puede usarse tanto en cuentas gratuitas como de pago en Android e iOS, la versión web aún no cuenta con ella. Además, por ahora, su disponibilidad parece restringirse al mercado estadounidense, lo que sugiere que se trata más de una fase de pruebas que de un lanzamiento completo.

Novedades en la Familia Gemini 2.5: Más Velocidad y Eficiencia

Más allá del procesamiento de videos, Gemini también ha recibido otras actualizaciones importantes esta semana. Los modelos Gemini 2.5 Pro y Gemini 2.5 Flash, anunciados en el Google I/O, han pasado de la fase de "preview" a "estable", estando ahora disponibles para todos los usuarios.

Adicionalmente, se ha introducido un nuevo modelo en fase de "preview": 2.5 Flash-Lite. Este modelo, disponible a través de Google AI Studio y Vertex AI, se perfila como el más rápido y rentable de la familia Gemini 2.5, ideal para tareas de alto volumen donde la eficiencia de costos es crucial. Es de esperar que pronto esté integrado en la aplicación de Gemini.

Con estos avances, Google está reforzando su posición en el ámbito de la inteligencia artificial, demostrando un compromiso claro con la innovación y la expansión de las capacidades de Gemini. 

↓ Sigue más contenido ↓



 
Paperblog