yolegó la edición 2024 del E/S de Google y la tecnológica americana viene con todo, introduciendo nuevas tecnologías al mercado soluciones en IA y optimizar los existentes con la promesa de seguir revolucionando el mundo digital a través de la inteligencia artificial. Entre las principales novedades, presentó la edición 2024 de I/O Géminis en vivouna nueva función que permitirá a los usuarios tener Chats de voz con IA a través de sus teléfonos inteligentes.
Google I/O 2024 trae propuestas que cambiarán el rumbo de la IA
Hace menos de un año que Google reveló oficialmente Géminis, su IA más ambiciosa que tendría como objetivo enfrentar ChatGPT, y desde entonces la compañía ha trabajado en numerosas optimizaciones para perfeccionar el modelo. Desde Mountainview, California, donde se llevó a cabo el evento, los líderes de la empresa compartieron que esta misión va viento en popa, ya que Géminis 1.5 Pro ahora puedes analizar documentos más largosasí como bases de código más largas, vídeos y grabaciones de audio.
Sin embargo, quizás su propuesta más atractiva en estos momentos sea Géminis en vivola función que permitirá al asistente de Google tener un conversación de audio con los usuarios. Esta herramienta tiene la capacidad de adaptarse a los patrones de habla de los usuarios, ofreciendo respuestas más conversacionales en 10 opciones de voz diferentesademás de tener acceso a las cámaras de los teléfonos inteligentes para interpretar el vídeo en tiempo real, una acción similar a la que se propone al mismo tiempo GPT-4o, el modelo más avanzado por ChatGPT.
«Queremos que todos se beneficien de lo que Gemini puede hacer. Así que hemos trabajado rápidamente para compartir esos desarrollos con todos ustedes. Hoy en día, más de 1,5 millones de desarrolladores utilizan modelos Gemini en nuestras herramientas. Lo están utilizando para depurar código, obtener nuevos conocimientos y crear la próxima generación de aplicaciones de inteligencia artificial. También hemos estado incorporando las capacidades revolucionarias de Gemini en nuestros productos de manera poderosa.«, señaló Sundar PichaiCEO de Google, durante todo el evento.
La IA de Google promete revolucionar también las imágenes
Además de darle una nueva personalidad (y por supuesto, voz) al nuevo asistente basado en IA, Gemini también será un aliado clave en Imagen 3, el nuevo modelo de imagen generativa. Según los desarrolladores, este modelo tendrá una mayor capacidad para comprender las indicaciones, traduciéndolas en Imágenes más realistas y creativas. con un margen de error menor y con artefactos que “distraen menos” en las imágenes finales.
En este mismo ámbito, la compañía introducirá Preguntar fotosuna nueva característica impulsada por Gemini que permitirá a los usuarios encontrar contenido específico en tu colección de Fotos de Google. Gracias al procesamiento del lenguaje natural mediante IA, será posible encontrar fotografías de determinadas personas, lugares e incluso objetos de forma más rápida, optimizando la experiencia del usuario.
Otras innovaciones de IA que estarán disponibles en el mercado
Para seguir ganando mayor participación en el mundo de la IA, Google aprovechó el escenario I/O 2024 para compartir simultáneamente la llegada de Géminis Nano, el más pequeño de sus modelos basados en IA. Este modelo se puede integrar directamente en la versión de escritorio de Chrome, lo que permite a los desarrolladores mejorar sus propias funciones de IA; por ejemplo, en la herramienta “ayúdame a escribir” de Workspace Lab disponible en Gmail.
Por último, pero no menos importante, Géminis se integrará de forma complementaria en el sistema operativo androidteniendo un impacto directo en la Google Apps. Una vez que se produzca esta integración, los usuarios podrán, por ejemplo, arrastrar y soltar imágenes creadas con IA en un correo electrónico de Gmail, así como en mensajes de texto y otras aplicaciones. Mientras tanto, en YouTube será posible utilizar la función “Preguntar a este video” para encontrar información específica dentro de un video, entre otras innovaciones que se implementarán próximamente.
Algunas de estas funciones ya están disponibles a través de Gemini 1.5 Pro, mientras que otros, como Ask Photos, estarán disponibles hasta verano.