Top.Mail.Ru

Израильские ученые разработали алгоритм авторского распознавания

21.07.2003

Израильские исследователи разработали несложный компьютерный алгоритм, который позволяет по лексике и синтаксису текста установить пол его автора, а также определить жанр, в котором он пишет. Вероятность правильного распознавания достигает 80%, причем даже при анализе научно-фантастической литературы, передает CNews.

Компьютерный алгоритм подтверждает и без того хорошо известный стереотип: каждый пол язык использует немного по-своему. Говоря по-простому, мужчинам более свойственно описывать сами объекты, а женщинам — взаимоотношения.

По словам автора программы Моше Коппеля из университета Бар-Илан в Рамат Гане, писательницы чаще употребляют личные местоимения. Писатели-мужчины в большей степени предпочитают использовать указательные местоимения и количественные числительные, что говорит об их склонности к обобщению, в то время как женщины любят персонифицировать.

Удивительно, но женский и мужской стили письма различаются так же сильно, как обычная проза и фантастика. Интересно также, что программа может отличить эти жанры друг от друга с еще большей вероятностью — в 98% — чем определить пол авторов.

Большинство исследованных работ были опубликованы после 1975 года. Теперь окрыленные успехом израильтяне собираются обратиться к более ранним литературным произведениям и выяснить, в частности, удалось ли английской писательнице Джордж Элиот скрыть свою женскую сущность под мужским псевдонимом, а также определить, прослеживаются или нет аналогичные зависимости в других языках.

{* *}