В России все еще низкие темпы вакцинации: привились всего около 15% населения вместо необходимых 60%. Таким показателям способствуют в том числе сообщества антипрививочников, которые собираются в телеграм-чатах и обмениваются информацией о вреде прививок. К примеру, они утверждают, что вместе с препаратом в организм вводят нанотехнологии для отслеживания. Порой там распространяют фейки.
«Они просто составляют сообщения из одних и тех же слов в разном порядке и в разных контекстах. Мне казалось, если закинуть их сленг в бездушный блендер нейросетей, может получиться довольно забавный смузи», — объяснил задумку Онегин.
Больше всего фраз нейросеть берет из чата «NASTIKA против вакцинации», потому что он «оптимальный по соотношению объем/шиза». Остальные чаты Онегин использовал «для затравки». Среди них — «Оставьте нас в покое!», откуда он взял 300 «самых истеричных» сообщений.
Проблемы появились на этапе постинга в твиттер. Нейросеть включает в запись фразы без «смехотворного абсурда» и не соблюдает лимит на символы, поэтому аналитик вручную обрезает некоторые предложения. «Сами фразы, за исключением обрезки лишнего, я не редактирую: ведь суть именно в том, чтобы показать, что машина способна выдавать конспирологию даже абсурднее, чем живые люди», — добавил он.
Вычислительной мощности компьютера Онегина не хватало для обработки такого массива данных. На помощь к нему пришел другой пользователь твиттера, у которого был доступ к вычислительному кластеру на GPU. Вместо недели обучения на массиве одного чата энтузиастам потребовалась всего одна ночь.






