vit_r: default (Default)
[personal profile] vit_r
[livejournal.com profile] infowatch пишет
Когда текст попадает в тематику "эротика и порнография", он блокируется цензурным фильтром. Но если одновременно присутствует рубрика "медицина" – он пропускается, поскольку очень многие тексты о здоровье и лечении терминологически близки к порнорассказам. Становится ясно, как порномастеру преодолеть цензуру. Надо использовать несколько "тяжелых" медицинских терминов; иногда хватает даже одного.

Date: 2012-02-16 08:50 pm (UTC)
From: [identity profile] alexott.livejournal.com
ну про весовые словари это давно известно... тут надо частоты определять
P.S. я DLP системами занимаюсь уже больше 10 лет, даже когда они не назывались DLP :-)

Date: 2012-02-16 08:54 pm (UTC)
From: [identity profile] vit-r.livejournal.com
Частоты могут отрубить автора, но не жанр.

Date: 2012-02-16 08:59 pm (UTC)
From: [identity profile] alexott.livejournal.com
ну только частоты все равно не используются, надо много параметров сопутствующих анализировать. Но алгоритмы постоянно меняются

Profile

vit_r: default (Default)
vit_r

June 2025

S M T W T F S
12345 6 7
891011121314
15161718192021
22232425262728
2930     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 8th, 2025 10:00 am
Powered by Dreamwidth Studios