08.05.2026
Google объявила о расширении Gemini API File Search — инструмента для построения retrieval-augmented generation-систем. В новой версии появились три ключевые возможности: мультимодальный поиск, пользовательские метаданные и постраничные ссылки на источники.
File Search теперь может обрабатывать изображения и текст вместе. Это позволяет строить приложения, которые ищут нужную информацию не только в текстовых документах, но и в визуальных материалах: диаграммах, иллюстрациях, скриншотах, фотографиях и других изображениях. По словам Google, новая возможность опирается на модель Gemini Embedding 2.
Отдельно важна поддержка page-level citations. Для систем, которые отвечают на вопросы по большим документам, это принципиальная функция: пользователь может проверить, с какой именно страницы был взят фрагмент информации. Для корпоративных и научных RAG-приложений такая проверяемость постепенно становится не дополнительным удобством, а обязательным требованием.
Источник: Google