Gemini API File Search получил поддержку мультимодального поиска

Google объявила о расширении Gemini API File Search — инструмента для построения retrieval-augmented generation-систем. В новой версии появились три ключевые возможности: мультимодальный поиск, пользовательские метаданные и постраничные ссылки на источники.

File Search теперь может обрабатывать изображения и текст вместе. Это позволяет строить приложения, которые ищут нужную информацию не только в текстовых документах, но и в визуальных материалах: диаграммах, иллюстрациях, скриншотах, фотографиях и других изображениях. По словам Google, новая возможность опирается на модель Gemini Embedding 2.

Отдельно важна поддержка page-level citations. Для систем, которые отвечают на вопросы по большим документам, это принципиальная функция: пользователь может проверить, с какой именно страницы был взят фрагмент информации. Для корпоративных и научных RAG-приложений такая проверяемость постепенно становится не дополнительным удобством, а обязательным требованием.

Источник: Google

Новости IT
8 мая 2026
Релиз Chrome 148

Связь с редакцией