«С вами говорит робот!»


В новосибирском Академпарке разработана IT-платформа для распознавания речи на русском и на английском языках
22 ноября 2017

Еще в XVIII столетии некоторые европейские философы-просветители, рассуждая о светлом будущем, утверждали, будто однажды тяжелую и унизительную работу обслуги возьмут на себя машины. Долгое время эта мечта казалась несбыточной. Да, с определенного времени роботы стали активно вытеснять ручной труд. Но до последнего времени нам казалось фантастикой сама возможность человека общаться с машиной. В экспериментальных целях, конечно, создавались «умные» говорящие машины, способные имитировать человеческую речь и выполнять какие-то голосовые команды, – примерно как в фантастических фильмах. Но всё это мы воспринимали как развлечение.

Однако в последнее время выясняется, что «говорящие» роботы – совсем не шутка. Мало того, массовое появление таких устройств может серьезно повлиять и на экономическую ситуацию, поскольку робот, умеющий распознавать человеческую речь, способен вытеснить большой список профессий. То есть машина в состоянии заменить человека не только там, где применяется ручной труд, но и там, где происходит общение между людьми. А таких областей достаточно много.

Своими достижениями в области IT-технологий поделился директор компании «Группа Фэмили» Андрей Заворин. Речь как раз шла о «говорящих» роботах. Как подчеркнул докладчик, с кейсом, который называется «речевые технологии», его компания столкнулась только в 2017 году.

«Если коротко, то с речевыми технологиями на рынке России работают всего около десятка компаний и несколько корпоративных подразделений. Вообще, рынок речевых технологий появился только в ноябре 2016 года, после того, как известные гиганты – Гугл, Яндекс, Амазон – открыли несколько библиотек, позволяющих получить очень высокое качество распознавания речи», - отметил Андрей Заворин.

Согласно представленным данным, способность роботов распознавать человеческую речь неуклонно возрастает. Так, в 1996 году порядок распознавания речи составлял 84%, в 2016 году этот уровень составил уже 94%. В текущем году мы уже можем говорить о 97 процентах. По словам Андрея Заворина, сегодня искусственный интеллект делает прогресс в данной области просто фантастическим. Если эти темпы сохранятся, то через год-два, считает он, процесс распознавания речи будет вплотную приближен к человеческому уровню.

Как воспользовались этой технической возможностью новосибирские разработчики? На базе речевых технологий они попытались сделать конкретные продукты для массовых клиентских коммуникаций. Как мы знаем, в наше время очень сложно дозвониться, например, до регистратуры местной поликлиники, чтобы записаться к врачу. Думаю, многие сталкивались с ситуацией, когда нужный нам телефон постоянно занят. Иногда уходит полдня, чтобы на другом конце провода вам кто-то ответил. С той же ситуацией мы сталкиваемся, когда пытаемся сдать показания счетчиков ЖКХ. Происходит это «событие» в строго определенный период, когда в службах коммунального хозяйства скапливаются огромные очереди. А если брать такие службы, как Ростелеком, то операторы бывают там порой так заняты, что приходится их «вызванивать» в течение нескольких дней.

«Когда мы сталкиваемся с большим количеством пиковых коммуникаций и загрузками колл-центров, - разъясняет Андрей Заворин, - то сразу же возникает проблема автоматизации. Собственно говоря, мы создали голосового чат-бота, который позволяет строить «умные диалоги» на базе существующей телефонии или в любых других каналах голосовых коммуникаций».

Предложенное техническое решение, по утверждению Андрея Заворина, очень легко масштабируется, позволяя одновременно обрабатывать до пяти тысяч коммуникационных линий. Причем, работающее решение было выдано только в конце августа этого года. А в октябре уже было осуществлено несколько сот тысяч распознаваний. В ноябре их будет около миллиона, и в течение следующего года ожидается кратный рост. «Созданные голосовые сервисы очень хорошо взаимодействуют с любой телефонией – облачной, виртуальной или реальной. И интегрируются с любой учетной платформой», - пояснил докладчик.

Интересно, что распознавание русской речи очень долго «тренировалось» Яндекс-навигатором. В итоге робот теперь «понимает» любые акценты, диалекты и шумы. Поэтому такой роботизированной услугой может воспользоваться даже иностранец или гость с юга. Система  способна также делать шумоподавление, семантический анализ, делать рассылки, вести расписание. То есть осуществлять весь комплекс решений, являющихся удобной платформой для клиента. Можно также делать автоматизированные рассылки и автоматизированные звонки.

Для наглядности были представлены конкретные диалоги клиента с роботом, где сдавались данные по оплате ЖКХ-услуг. Действительно, качество генерируемой речи было очень высоким, почти неотличимой от человеческой речи. Клиенту вежливо сообщалось, что он общается с роботом. Чтобы не возникало ошибок, машина повторяла сообщенные ей данные и просила подтверждения. Сам диалог, в принципе, не вызывал никакого эмоционального отторжения. Поэтому есть надежда на то, что эти системы со временем вполне нормально приживутся в сфере услуг.

Принципиально важно здесь то, что такой робот способен заменить значительную часть колл-центра, выполняя работу в 5-10 раз дешевле и в десятки раз быстрее! Автоматизация клиентских коммуникаций серьезно сокращает количество рутинных операций в клиентском отделе, делая выполнение операций в несколько раз эффективнее.

Правда, нарисованная перспектива не может не навести на некоторые философские размышления. Если машины так активно наступают по всем фронтам, то как это в итоге отразится на занятости населения? Примечательно, что об угрозе со стороны искусственного интеллекта сегодня заговорили выдающиеся личности. Например, знаменитый английский физик-теоретик Стивен Хокинг несколько раз обратил внимание на опасность, исходящую-де от «умных» машин. Совсем недавно схожие опасения высказал авторитетнейший бизнесмен-инноватор Илон Маск. 

Возможно, не стоит принимать близко к сердцу мрачные прогнозы. Во всяком случае, сценарий в духе голливудского «Терминатора» нам вряд ли грозит. Однако сокращение привычных рабочих мест, скорее всего, – неизбежность ближайшего времени. Эффективность, помноженная на высокое качество, – это именно то, к чему стремятся продвинутые руководители. Поэтому у голосовых технологий, вне всяких сомнений, есть будущее. В том числе и в нашем городе.

Олег Носков