Рубрики NoticiasSuaveTecnologías

Google regala Gemini 1.5 Pro «orejas» y lanza Vertex AI bot builder

Опубликовал
Катерина Даньшина

Según se anunció en el evento Google Next, a partir de ahora Gemini 1.5 Pro escuchará a sus usuarios — en la práctica, el modelo podrá escuchar archivos de audio cargados o extraer información de llamadas y vídeos sin necesidad de descargar transcripciones.

El propio Gemini 1.5 Pro se lanzado por primera vez en febrero y es actualmente el modelo lingüístico más potente de Google (superando en rendimiento a Gemini Ultra). Sin duda, su principal característica es la cantidad de contexto que el modelo puede procesar: de 128.000 a 1 millón de tokens. Un millón de tokens equivale a unas 700.000 palabras o a unas 30.000 líneas de código — son unas cuatro veces más datos que el El modelo estrella de Anthropic, Claude 3y unas ocho veces más que GPT-4 Turbo max por OpenAI.

Gemini 1.5 Pro estará disponible en versión preliminar en Vertex AI — una nueva plataforma en la que los clientes empresariales de Google pueden crear sus propios chatbots.

También se ha actualizado el modelo de texto a imagen de Imagen 2 — y ahora ofrece las funciones «inpainting» y «outpainting», que permiten a los usuarios añadir o eliminar elementos de las imágenes. Todas las imágenes generadas por la red neuronal también pueden recibir la marca SynthID — una marca de agua invisible que indica el origen de la imagen.

Fuente: The Verge, Techcrunch

Los comentarios de Disqus están cargando....