• Главная
  • Новости
  • Статьи
  • Книги
  • Видео
  • Хабы
  • Каналы
  • RU
  • EN
  • 19 May, 25
  • О Проекте
  • Контакты
ДотДев
  • Главная
  • Новости
  • Статьи
  • Книги
  • Видео
  • Хабы
  • Каналы
  1. ДотДев
  2. Статьи
  3. 5 причин, почему технология Google для перевода голоса в текст в Telegram — это безопасно
Содержание
5 причин, почему технология Google для перевода голоса в текст в Telegram — это безопасно 1. Автоматически никакие данные никуда не передаются 2. Google не получает персональные данные 3. Google не может слить ту информацию, которую получил 4. Это не работает в секретных чатах 5. Сейчас трудно создать свой аналог этой технологии

5 причин, почему технология Google для перевода голоса в текст в Telegram — это безопасно

22 июня в русскоязычном информационном пространстве распространилась информация о том, что Telegram использует технологию распознавания речи Google для перевода голосовых сообщений в текст. Эта фишка доступна в подписке Telegram Premium.

На это обратил внимание пользователь Хабра, который возмутился, что Telegram, «явно обозначавший свой стек и стремление к "независимости", не разработал своё in-house решение (или не лицензировал on-premise решение) и просто отправляет данные клиентов в API Google».

Издание SVTV NEWS и вовсе утверждает, что «теперь, когда личные данные пользователей отправляют на обработку третьим лицам, Telegram никак не может гарантировать приватность голосовых сообщений».

А Telegram-канал «Двач» пишет: «многоходовочка, играющая на паранойе войсодетей. ЧЗХ!? Войсов наконец-то станет меньше!?» Негативный контекст, вызванный возмущением использования технологии Google, приобретает массовый характер.

«Код Дурова» объясняет, почему использование технологии распознавания речи от третьей стороны в Telegram – это безопасно.

Автоматически никакие данные никуда не передаются

Telegram не скрывает факт использования технологии от третьей стороны. Это прописано в пункте 7.4 условий обслуживания мессенджера и пункте 8.5 Политики конфиденциальности Telegram. Важно то, что абсолютно любой человек, продолжая использовать Telegram, соглашается с «Условиями обслуживания».

Некоторые пользователи могут преобразовать голосовое сообщение в текст, нажав на значок перевода голоса в текст («->A»), отображаемый в голосовых сообщениях ...
... Поскольку Telegram для преобразования голоса в текст может полагаться на третью сторону (Google LLC, дочерняя компания Alphabet Inc), содержание голосовых сообщений, которые пользователи решают преобразовать в текст, может быть передано Google для получения их расшифрованных версий.

Функция перевода голосовых сообщений для пользователей Telegram Premium задействуется только с теми сообщениями, в которых обладатель подписки целенаправленно нажал на кнопку преобразования голоса в текст («->A») и тем самым передал Google соответствующую речь.

Автоматически распознавание голосового сообщения и, соответственно, его обработка технологией от Google не задействуется. Это видно на практике:

  • Только после нажатия на кнопку начинается процесс перевода. Он длится несколько секунд и если голосовое сообщение длинное, на преобразование может потребоваться время.
  • Если бы Telegram автоматически отсылал речь Google, все голосовые сообщения при их появлении сразу же были бы переведены в текст и после нажатия на кнопку он мог появляться моментально. Но так это не работает.

Процесс конвертации голосового сообщения в текст запускается лишь в случае, когда пользователь, у которого и так есть доступ к голосовому сообщению, нажатием на кнопку «Перевести в голос» передаёт Google соответствующую речь.

  • Это говорит о том, что у пользователя есть своё право и желание обрабатывать полученную информацию так, как ему захочется. И Telegram фактически упрощает то, что пользователи делали и ранее.
  • Никто не беспокоился из-за того, что отправлял для перевода в текст голосовые cообщения, например, сторонним ботам, которые, к слову, для реализации функции используют те же технологии, что и мессенджер.

Google не получает персональные данные

Если верить официальной информации, очевидным становится, что Telegram задействует возможности, которые предоставляются GCP Cloud Speech API. Реализацию преобразования голоса в текст можно осуществлять через соответствующий сервис в Cloud Speech-to-Text.

Согласно «Условиям регистрации данных», прописанным в Google Cloud, компания предупреждает о правилах Политики конфиденциальности Google и указывает на то, что Google не регистрирует все данные, а использует только те, которые передаются в Speech-to-Text с включенным протоколированием:

Только ограниченный круг уполномоченных сотрудников и подрядчиков Google имеет доступ к вашим данным, собранным с помощью регистрации данных. Google использует эти данные исключительно для обучения и улучшения продуктов и служб Google.

Более того, Google позволяет сохранять контроль над своей инфраструктурой и защищёнными речевыми данными (в случае с Telegram — голосовыми сообщениями), используя технологию распознавания речи компании в собственных частных центрах обработки данных.

Как сообщил «Коду Дурова» источник, близкий к команде Telegram, до Google доходит только голос. Какие-либо уязвимые персональные данные пользователя, в том числе IP-адрес или номер телефона Google не получает, а это значит, что таргетирование рекламы на пользователя не является возможным.

Пользователь «Хабра» верно отметил факт того, что у Google «очень прочная политика конфиденциальности»:

То есть твои голосовые не прослушает ни один федерал, а уж тем более в России.

В качестве объяснения параллель можно провести с сервисами Google Play Services, которые по умолчанию установлены на невероятное количество Android-смартфонов. Дело в том, что Google изначально имеет доступ к устройствам подавляющего большинства пользователей, в том числе к геолокации или пуш-уведомлениям.

Даже если у человека iPhone, пуши от его сообщений, адресованные владельцу Android-смартфона, обрабатываются Google Play Services.

Google не может слить ту информацию, которую получил

Возвращаясь к технологии распознавания речи, сам Google, которого в народе прозвали «корпорацией зла», утверждает, что в рамках своей технологии использует данные лишь для расшифровки и последующего предоставления пользователю текста:

Google не использует ваши данные или какую-либо персонально идентифицируемую информацию, содержащуюся в собранных вами данных, для целевого назначения продуктов, услуг или рекламы вам, вашим пользователям или вашим клиентам.

Политике конфиденциальности Google можно не доверять, но компании, которая и так часто сталкивается с различными обвинениями и судебными процессами, сегодня нет никакого смысла нарушать свою же политику и подставляться под скандалы, потерю репутации и штрафы от мировых регулирующих органов на десятки миллиардов долларов.

Злоупотребление полученными данными в теории позволило бы компании использовать их для генерации дополнительной прибыли, однако здесь есть важные моменты:

  • Google, как один из мировых лидеров в сфере распознавания и перевода речи, и так достаточно зарабатывает на своей технологии.
  • С данными, которые компания получает для преобразования речи в текст, фактически ничего сделать нельзя. Они обезличены и для условных таргетинговых компаний их невозможно использовать.

Это не работает в секретных чатах

Для всех самых ярых защитников конфиденциальности у Telegram есть особая функция — секретные чаты. Напомним, этот метод использует шифрование по криптографическому протоколу MTProto с передачей сообщений от устройства до устройства. Он не оставляет следов общения на серверах Telegram.

Исключается попадание хоть какой-либо информации и в случае с функцией конвертации голосовых сообщений в текст. Дело в том, что эта фишка не работает в секретных чатах. Это важный момент, который вновь напоминает о том, что Telegram придерживается своих принципов и идеологии секретных чатов.

Сейчас трудно создать свой аналог этой технологии

Действительно, многие считают, что Telegram мог бы сделать собственное in-house решение — продукт, который позволяет хранить данные на своих серверах, полностью их контролировать и предотвращать вероятность утечки какой-либо информации. Для этого нужны деньги.

Telegram только недавно запустил рекламную платформу и подписку Premium. По словам Павла Дурова, от 2,5 до 3% премиум-подписчиков от общего числа пользователей смогут полностью покрыть расходы мессенджера. Но нужное количество подписчиков для начала необходимо собрать.

На использование on-premise решения в виде технологии Cloud Speech-to-Text команда Telegram тратит до одного доллара с обладателя подписки Telegram Premium. Об этом «Коду Дурова» сообщил близкий к мессенджеру источник.

Собеседник уточнил, что Telegram в этой ситуации пошёл на значительные дополнительные издержки ради максимизации качества транскрипции.

Сейчас достаточных для реализации in-house решений средств, очевидно, нет — нужно понимать, что собранные на коленке решения приведут лишь к худшему качеству их работы на практике. А вот с on-premise решением мессенджер уже предоставляет лучшие условия в Telegram Premium на старте запуска продукта.

Позже можно будет привлекать специалистов, которые реализуют технологию распознавания речи не хуже, чем у Cloud Speech-to-Text от Google или Yandex SpeechKit от Яндекса. Telegram мог бы самостоятельно реализовать функцию как тот же ВКонтакте, однако мессенджер нуждается не только в русском языке — их десятки.

Следовательно, создание собственного in-house решения является в десятки раз более масштабной задачей. На уровне Cloud Speech-to-Text, который уже в 2018 году поддерживал 120 языков, её невозможно решить даже за пару-тройку лет.

Тэги
Статьи
  • 23 Jun, 22
  • 0 комментарии
  • 323 просмотры
Источник материала
https://kod.ru/telegram-and-google-speech-to-text
ПОДЕЛИТЬСЯ:

Джо Блэк
Джо Блэк

Автор новостей IT/Tech

Комментарии
  • 1000+
    Подписки
  • 1000+
    Фолловеры
  • 1000+
    Фолловеры
Тэги
  • Python (230)
  • Программирование (181)
  • 2022 (170)
  • 2020 (151)
  • 2023 (149)
  • 2021 (128)
  • Java (128)
  • Linux (119)
  • 2019 (117)
  • Алгоритмы (112)
  • JavaScript (100)
  • Сети (99)
  • Api (92)
  • Инструменты (90)
  • Web (86)
  • Applications (79)
  • Microsoft (73)
  • PHP (73)
  • Google (72)
  • Обучение (72)
  • 2018 (68)
  • SQL (68)
  • C# (66)
  • ИИ (63)
  • Windows (60)
  • HTML (59)
  • 2017 (55)
  • C++ (53)
  • Базы данных (53)
  • Machine Learning (51)
  • Kubernetes (50)
  • Go (47)
  • Бизнес (47)
  • Паттерны (46)
  • CSS (44)
  • Проекты (42)
  • 2016 (41)
  • ИБ (41)
  • ОС (40)
  • .NET (39)
  • DevOps (39)
  • Docker (39)
  • React (39)
  • Проектирование (38)
  • Тестирование (38)
  • Математика (36)
  • Android (35)
  • Структуры Данных (35)
  • Информатика (34)
  • Framework (32)
Программирование
  • Python
  • Go
  • C#
  • Java
  • JavaScript
  • TypeScript
  • PHP
  • Ruby
  • Kotlin
  • Rust
  • C++
  • C
Скилы
  • Обучение
  • Инструменты
  • Истории
  • Data Science
  • Git
  • Тестирование
  • Проектирование
  • Алгоритмы
Софт
  • Linux
  • Windows
  • Android
  • iOS
  • Архитектура и OS
  • Базы данных
  • Backend
  • Frontend
Дизайн
  • UI/UX
  • Дизайн
  • Интерфейсы
  • Графический Дизайн
  • Game Design
Железо
  • Устройства и IoT
  • Компьютеры
  • Гаджеты
Другое
  • Бизнес
  • Стартап
  • Трудоустройство
  • Общее
  • Разное
Контакты
  • Условия использования
  • Политика конфиденциальности
  • О Проекте
  • Контакты

© 2025. ДотДев — Информационный ресурс для IT-специалистов.