A IA acapara o Google I/O 2024
martes, 14 de maio do 2024
A presentación de GPT-4o por parte de OpenAI na xornada do luns conseguiu o seu obxectivo: eclipsar a celebración do Google I/O 2024 co que Google quería presumir dos seus avances en intelixencia artificial, no que dan en chamar a súa era Gemini.
Durante o evento de presentación da compañía de Mountain View realizaron numerosas demostracións dos modelos de Gemini, que agora presumen de capacidades multimodais avanzadas, mentres que Gemini 1.5 Pro é capaz de manexar 1 millón de tokens de xeito consistente na súa versión en produción, prometendo que agora poden chegar aos 1,5 millóns de tokens (e abrindo a experiencia con 2 millóns de tokens a usuarios dunha versión preliminar privada). Todas estas capacidades están a espallarse polos distintos servizos de Google, como o buscador, Fotos, Android... deixando claro que a IA é o eixe ao redor do que xira a compañía actualmente.
O máis relevante é que agora está a potenciarse a experiencia de busca xenerativa, de xeito que o buscador de Google está a transformarse para adoptar funcións de IA, que polo momento está en probas, pero que paulatinamente irá abríndose a distintos territorios a partir desta mesma semana.
Google Fotos tamén mellora as súas funcións de IA, de xeito que poderemos realizar consultas relativas aos seus contidos, o que practicamente pode ser un resumo das nosas vidas, xa que ao recoñecer as persoas e os contextos, pode localizar dende os números de matrículas dos coches até as actividades de lecer que retratásemos coa familia no verán.
Os usuarios profesionais tamén poderán introducir as novas capacidades de IA nas súas actividades, de xeito que Gemini servirá para resumir correos electrónicos, analizar o contido de documentos PDF, detallar o máis destacado dunha xuntanza en Google Meet ou axudar a escribir un borrador dunha mensaxe.
Para tarefas diarias chegará Project Astra, un sistema multimodal capaz de entender o noso contorno e co que poder conversar en tempo real, que ten a vocación de converterse nunha especie de axente universal.
No caso de Android continúa a avanzarse na integración da IA, comezando polos dispositivos da familia Pixel, e buscando avanzar especialmente con Gemini Nano, unha versión do modelo de IA capaz de correr en local e que tamén é multimodal,de xeito que cada vez poderemos procesar máis información dende o propio dispositivo, mantendo así a privacidade da nosa información.
Tampouco faltaron presentacións dos modelos de imaxe e vídeo Veo e Imagen 3, así como do modelo aberto Gemma 2.0, buscando así deixar claro que Google está á altura dos desenvolvementos de OpenAI e Meta, aínda que para constatar que iso é así haberá que agardar a que todo o presentado chegue ao mundo real.
Vídeo coa presentación principal do Google I/O 2024