Я уже много лет не пишу в фейсбуке статусов от себя — исключительно перепощиваю чужие лингвистические приколы. Так вот, вчера Цукерберг порекомендовал мне страницу какой-то писательницы, у которой таких приколов тоже много. Юмор, там, правда, на мой вкус грубоват. Эти тонкости, видимо, будут видеть нейросети следующего поколения.
Выявить мат в потоке речи видеоролика тоже технически вполне возможно — роботы типа Алисы, Маруси, Siri выделяют и понимают наиболее употребимые слова, говорит Комлев.
Бен Блатт с помощью Big Data исследовал романы самых известных писателей и выбрал слова, которые они чаще всего употребляют. (...) В трех романах Джеймса Джойса: трамвай, белло, хи, старый, твой, его.
Задал я гуглу запрос «чехов крыжовник» (зашла речь в одном треде, захотелось перечитать). Внизу страницы выдачи показывает семь обложек книг Чехова на английском и семь обложек книг не Чехова, но, надо полагать, как-то с его гугловской точки зрения с запросом связанных. В числе этих семи — Leo Tolstoy. How much land does a man need?
Попадание абсолютно точное, и при этом в тексте нет прямого упоминания ни этого рассказа, ни его автора. Правда, что ли, алгоритм установил связь?