Платим блогерам
Редакция
Новости Hardware Mindango
Но они быстро учатся.

реклама

Люди всячески стремятся научить вычислительные устройства разнообразным вещам вроде распознания образов, умения ориентироваться в пространстве, понимания человеческой речи. Некоторые из этих задач успешно реализуются техническими средствами, но есть и другие, которые машина пока выполнять не в состоянии.

Компьютер может распознавать голос, однако "читать по губам" – этот навык обычно приписывается высококлассным шпионам – электроника вряд ли научится в ближайшее время. В этом уверен Ахмад Хассанат (Ahmad Hassanat), исследователь из Иордании, о чём пишет сайт MIT Technology Review. Он поясняет, что в человеческой речи используется более 50 различных звуков, в то время как для их произнесения губы могут принимать всего 10-14 форм. Таким образом, чтение по губам требует не только сопоставления формы и звука, но и наблюдения за "языком тела", знания контекста разговора и интуиции. Нередко губы говорящего оказываются скрыты, отчего часть "разговора" теряется.

реклама

Эксперименты показывают, что машинное чтение по губам даже слов из ограниченного набора (например, цифр) оказывается успешным лишь в 50% случаев, что нельзя назвать удовлетворительным результатом. В собственных экспериментах с тщательно контролируемыми условиями Хассанат добился показателя успешности на уровне 76%, причём значение ещё выше для женщин – у них отсутствуют усы и борода, затрудняющие распознание форм губ.

Визуальное распознание речи определяет целый ряд технических проблем и поднимает вопросы о конфиденциальности и неприкосновенности личного пространства. Кто знает, для каких целей такая перспективная технология может использоваться?

Написать комментарий (0)

Сейчас обсуждают