Языковой фильтр «LF-сервис»

Сервис создан для борьбы с нецензурной лексикой, противоправным контентом вроде порнографии, терроризма, пропаганды. Разные типы словарей для разных языков будут постепенно добавляться, в том числе оскорбления, упоминание известных лиц и так далее.

Что значит «LF»?

Простая расшифровка: Language Filter. На английском — потому что доменные имена все еще удобнее на латинице, потому что названия ботов возможны только на латинице, но мы из России.

Зачем

За чистоту речи, за морально-нравственные принципы, за подрастающее поколение.

Отсутствие матов, пропаганды, порнографии, подозрений на террористическую деятельность снижает внимание уполномоченных органов. К тому же культурная речь, чистота изъяснений, безэмоциональное решение вопросов — то, о чем интернет редко слышит, то, что привлекает умных и платежеспособных людей.

В общем, это не просто правильно, но и выгодно.

В чем особенность

Мы работаем над тем, чтобы приблизиться к разнообразию человеческой речи и распознавать завуалированные слова при помощи дублирования букв, написание транслитерацией, заменой букв на символы, вставкой неразрывных пробелов и т.д.

Версия API v1 — первая, простая версия. Ее мы создали в качестве пробника идеи и для сбора обратной связи. API v1 работает при помощи прописанной логики обнаружения, разбором слов.

Следующая версия v1.1-v1.2 будет более гибкой и сможет принимать ваш словарь в обработку, видеть спрятанные, завуалированные слова (на самом деле, это уже готово, но мы работаем над ресурсоемкостью). Версия v2 будет уже с более серьезным подходом.

Где использовать

Использовать можно везде, где появляется много текстовой информации, например:

  1. бот фильтра матов для мессенджеров (Telegram, Discord)
  2. контент-фильтр комментариев и публикаций в соцсетях (VK, OK и т.д.)
  3. сообщения на форумах, досках объявлений
  4. комментарии на видеохостингах (Twitch, Youtube, Trovo)
  5. статьи и комментарии на сайтах, особенно детских
  6. телевизионные передачи с обратной связью онлайн (например, «Что? Где? Когда?» на Первом или «Ответ священника» — на Спасе) — для фильтрации сообщений от зрителей
  7. при написании голосовых помощников, в формах обратной связи, в играх

Применение фильтру найдется масса, а одно из достоинств — вы сами определяете, что делать при обнаружении запрещенного слова. Наша система не удаляет самовольно, но вы можете настроить свой скрипт так, что можно уведомлять модератора, ставить метку на пользователя, отправлять в черновики и прочее.

Как внедрить

Наши разработки

Мы работаем над созданием собственных приложений: виджетов, плагинов, ботов — чтобы внедрение сервиса было простейшим. На этот момент мы можем предложить:

  1. 18.04.22 создан телеграм-бот для групп и каналов (описание в личном кабинете).
  2. На финише разработка бота для Discord.
  3. Прочее в разработке

Ваш скрипт предпочтительнее

Несмотря на то, что мы создаем свои приложения, чья-то аналогичная разработка может оказаться более успешной, ведь LF-проект ориентирован на программистов, которые будут использовать наши API и самостоятельно создавать приложения для своих сайтов, каналов, групп и т.д.

Так мы открываем почти безграничное использование проекта по вашим правилам, а также даем возможность другим зарабатывать на нашей услуге.

С чего начать

Прежде всего нужна регистрация на сайте. Так пользователь получает уникальный main_token (в личном кабинете) и может пользоваться нашими API.

Если используете наши приложения, вроде Телеграм-бота, то необходимо следовать инструкциям из личного кабинета — раздел «Наши разработки».

Если создаете свое приложение, то:

  1. Зарегистрируйтесь.
  2. При помощи API создайте источник.
  3. При помощи API настройте источник: отдельный баланс, метки.
  4. При помощи API отправьте текст на проверку и получите результат.

При первой регистрации автоматически будет пополнен промо-баланс, который можно расходовать так же как и основной.

В личном кабинете вы можете предлагать сервису свои слова для его улучшения и общей пользы.

Демо-форма

В форме ниже вы можете протестировать разнообразным способом наш сервис. Вы можете взять примеры со своего сайта, канала или даже текст с http://lurklurk.com .

В данной форме существуют все ограничения, которые приняты в API, в частности, максимальное количество знаков в форме — 1000. Сейчас форма работает с API v1.

Ответ будет предоставлен ниже формы примерно в том виде, в каком его получит ваш скрипт в формате JSON. В ответе вас будет интересовать, в первую очередь, ключ check_result. Мы не заявляем, что абсолютно всё будет найдено, но стремимся к этому, в том числе с вашей помощью.

Протестировать
Сообщить об ошибке (скрипт не увидел или увидел не то)