Оглавление:
Видео: Три новых многоязычных модуля USE переходят на TensorFlow
2024 Автор: Kayla Nelson | [email protected]. Последнее изменение: 2023-12-17 01:34
Google - один из пионеров исследований в области искусственного интеллекта, и множество их проектов вскружили голову. AlphaZero от Google DeepMind команда совершила прорыв в исследованиях искусственного интеллекта благодаря способности программы самостоятельно изучать сложные игры (без обучения и вмешательства человека). Google также проделал отличную работу в Программы обработки естественного языка (НЛП), что является одной из причин эффективности Google Assistant в понимании и обработке человеческой речи.
Google недавно объявил о выпуске трех новых ИСПОЛЬЗУЙТЕ многоязычные модули и предоставить больше многоязычных моделей для получения семантически похожего текста.
Первые два модуля предоставляют многоязычные модели для получения семантически похожего текста, один из которых оптимизирован для производительности поиска, а другой - для скорости и меньшего использования памяти. Третья модель специализируется на поиске вопросов-ответов на шестнадцати языках (USE-QA) и представляет собой совершенно новое приложение USE. Все три многоязычных модуля обучаются с использованием многозадачной структуры двойного кодировщика, аналогичной исходной модели USE для английского языка, при этом используются методы, разработанные нами для улучшения двойного кодировщика с подходом softmax с аддитивным запасом. Они предназначены не только для поддержания хорошей производительности обучения передачи, но и для эффективного выполнения задач семантического поиска.
Обработка языка в системах прошла долгий путь - от синтаксического анализа базового дерева до больших векторных ассоциативных моделей. Понимание контекста в тексте - одна из самых больших проблем в области НЛП, и универсальный кодировщик предложений решает эту проблему, преобразовывая текст в многомерные векторы, что упрощает ранжирование и обозначение текста.
Согласно Google, « Все три новых модуля построены на архитектуре семантического поиска, которая обычно разделяет кодирование вопросов и ответов на отдельные нейронные сети, что позволяет осуществлять поиск среди миллиардов потенциальных ответов за миллисекунды. Другими словами, это помогает лучше индексировать данные.
“ Все три многоязычных модуля обучаются с использованием многозадачной структуры двойного кодировщика, аналогичной исходной модели USE для английского языка, при этом используются методы, разработанные нами для улучшения двойного кодировщика с подходом softmax с аддитивным запасом. Они предназначены не только для поддержания хорошей производительности обучения передачи, но и для эффективного выполнения задач семантического поиска.. » Функция Softmax часто используется для экономии вычислительной мощности путем возведения векторов в степень и последующего деления каждого элемента на сумму экспоненты.
Архитектура семантического поиска
«Все три новых модуля построены на архитектурах семантического поиска, которые обычно разделяют кодирование вопросов и ответов на отдельные нейронные сети, что позволяет осуществлять поиск среди миллиардов потенциальных ответов за миллисекунды. Ключом к использованию двойных кодировщиков для эффективного семантического поиска является предварительное кодирование всех возможных ответов на ожидаемые входные запросы и сохранение их в векторной базе данных, оптимизированной для решения проблемы ближайшего соседа, что позволяет быстро найти большое количество кандидатов с хорошими точность и отзыв »
Вы можете скачать эти модули с TensorFlow Hub. Для дальнейшего чтения обратитесь к полной записи блога GoogleAI.
Рекомендуемые:
ЛУЧШЕЕ ИСПРАВЛЕНИЕ - ошибка заблокированного подключаемого модуля в Safari
Исправить проблему очень просто. Проблема в том, что в предыдущих версиях Adobe Flash Player, который нужен большинству сайтов, нет
Ожидайте нехватки твердотельных накопителей, поскольку многие тайваньские производители переходят на нишевые рынки
С начала 2019 года цены на технологии хранения данных 3D NAND, такие как твердотельные накопители, eMMC и флеш-карты, снижаются. Согласно сообщению
Профессиональные хакерские группы переходят на новую форму вредоносного ПО с помощью AndroMut, нацеленного на финансовую информацию и банки с помощью социальной инженерии
Похоже, что профессиональная хакерская группа, владеющая изощренными методами фишинга и других видов вредоносных атак, меняет свое направление
Facebook готов внедрить три новых динамических стиля рекламы
Facebook закончил свою эру крутизны после того, как начал продавать рекламу конечному пользователю. Мы видели в фильме «Социальная сеть», что добавление рекламы на сайт было
AMD объявляет о выпуске новых чипов Ryzen с Zen 3 серии 5000: сегодня будет анонсировано как минимум 4 новых процессора
AMD действительно продвигалась вперед со своими процессорами Ryzen в течение последних двух поколений. Предлагая вычислительную мощность и графическую производительность в