Системы лингвистической стеганографии - сокрытия информации среди устной речи или текста - до настоящего времени не считались достаточно стойкими. Однако бельгийские ученые показали, что стеганография может быть успешно применена в интернет-чатах.
Использование естественного языка в стеганографических системах оправдано - компьютеры пока еще плохо справляются с его анализом. Однако добиться "естественности" языка в лингвистических стегосистемах - непростая задача.
Стеготексты, основанные на форматировании, например, вставке лишних пробелов, могут легко распознаваться методами автоматизированного статистического анализа. Если же стегосистемы базируются на использовании слов, несущих специально обусловленное значение, то проблемой становится естественное звучание текста. Такие стеготексты легко детектируются "на слух" специалистами по лингвистике.
Брехту Визюру (Brecht Wyseur) с коллегами из Католического университета Левена удалось продемонстировать, что IRC-чаты пригодны для использования в качестве стойкого стегоканала. Исследователи применили комбинированную машинную и ручную стеговставку. Информация передавалась через клиентскую программу X-Chat.
Предложение ученых основывалось на том, что замена слов синонимами при стеговставке затрудняет распознавание стегоканала системами слежения. Сообщение шифровалось с помощью алгоритма RC4 и скрывалось в стеготексте. Для генерации подстановочных таблиц со словами-синонимами и сеансового ключа для RC4-шифрования применялся секретный ключ, согласованный по протоколу Диффи-Хеллмана. Пользователь стегосистемы мог выбрать один из трех автоматически сгенерированных синонимов, наиболее подходящий по контексту. Это придавало тексту "естественность".
Использование стеганографии через интернет-чаты не лишено своих недостатков, считают исследователи. Это ограничение по длине сообщения, несоответствие некоторых слов личному словарю отправителя (что может быть отмечено системой слежения) и возможность грамматических ошибок.
Однако у таких систем есть и важное преимущество - общение в интернет-чатах может носить анонимный и безличный характер. Поэтому создание лингвистических стегосистем, подобных описанной, неизбежно усложнит отслеживание скрытой информации.