Команда инженеров Microsoft из подразделения занимающегося разработками в области искусственного интеллекта, заявила, что их система распознавания речи достигла значения равного 5,9 процентов в параметре определяющего количество ошибок (WER, word error rate), что сопоставимо с возможностями человека.
«Мы достигли равенства с человеком», — заявил ведущий учёный компании, занимающийся технологиями обработки речи, — «Это историческое достижение».
Для достижения полученного уровня точности, исследователи использовали сети глубинного обучения и большие наборы обучающих данных, на основе которых система училась распознавать речь. Для большей эффективности, при обучении были использованы как звуки, так и изображения.
Исследователи поясняют, что достигнутое равенство ещё далеко от совершенства. Это означает, что хоть новая система также хороша как и человек, но и люди не безупречны.