Голосовые помощники

За последние 10 лет появилось множество программных систем, связанных со смысловым распознаванием текста и голоса. Различные базы знаний, голосовые помощники, продвинутые чат-боты. У меня нет возможности оценить их качественно самому, так как в оригинале они разрабатываются, в первую очередь, для английского языка, а локализованные на русский язык версии находятся ещё в стадии тестирования. Поэтому сравнивать напрямую с СИМ, эти разработки, я могу лишь по информации в аналитических статьях и со слов очевидцев. Аналогичные самостоятельные разработки в России вообще находятся в зачаточном состоянии.

Так или иначе, функционал, который будет реализован в СИМ, в какой-то мере уже имеется и в, к примеру, Cortana, Siri или Viv, немного особняком стоят Amazon Echo и Google Assistant, имеющие более утилитарную функциональность. Но всё равно мою разработку не стоить сравнивать с этими разработками гигантов IT индустрии на прямую. Просто потому, что СИМ разрабатывается с нуля и на основе моих собственных представлений, о том каким должен быть виртуальный собеседник и помощник. Ставлю ли я задачу их догнать и перегнать? Эти несколько лет, что работаю над Языком Образов и СИМ, мне было абсолютно безразлично, что из себя представляют эти разработки, хотя я знал об их существовании.

Почему всё-таки не занимаюсь анализом всех этих программ и облачных сервисов, ведь, наверное, можно было бы подчерпнуть для себя и для СИМ что-то полезное, избежать многих «граблей» на пути разработки СИМ, сэкономить массу времени? Всё очень просто, когда 10 лет назад я вплотную занялся вопросами создания искусственного интеллекта, начал изучать различную литературу, пробовать кодировать решение некоторых задач на Phyton, то, вникая в детали, оглядев картину в целом, понял что всё это – не тот путь. Но в то же время я начал серьёзно изучать психологию и пришёл к выводу, что не надо полагаться на сложные математические модели и разум человека работает несколько иначе, чем его пытались представить многие математики и программисты раньше.

Думаю, что во всех выше перечисленных разработках, отсутствует самое главное, это внутренний язык моделирования и прогнозирования окружения, который также используется для программирования функционирования самой СИМ. Так сложилось исторически, что программирование в основном базируется на математике, это пошло от первых вычислителей-калькуляторов, даже используемое повсеместно слово компьютер, также переводится на русский язык как вычислитель. Компьютеры и программы для них в первую очередь были необходимы для расчётов, поэтому не стоит удивляться тому, что за десятилетия их развития, база осталась всё та же. Есть, конечно, исключения, к примеру, язык Prolog, используемый не для цифрового, а символьного вычисления, на основе математической логики. Впрочем, и тут мы видим те же термины вычисление и математика.

Мои многолетние наблюдения, как психолога, позволяют судить, что разум человека не основан на вычислениях, поэтому система имитации мышления, также должна использовать другие принципы, а вычисления можно использовать уже в отдельных случаях, когда это и вправду необходимо. Наибольшее значение имеет возможность смоделировать окружение, определить взаимное расположение объектов в нём и главное это учесть множество взаимосвязей-взаимодействий между ними. Да и, задача непосредственного распознавания голосовых сообщений в СИМ, не стоит на первом плане, это просто одна из множества подзадач, которые нам предстоит решить.

https://geektimes.ru/company/madrobots/blog/242653/

http://prorobots.livejournal.com/33748.html

http://telecomblog.ru/gadjeti-i-uslugi/pepper-robot-s-serdtsem

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *