Всем привет.  Сегодня хочу вам рассказать несколько “фишек” при работе с кейвордами.

Первая, по необходимости программа для работы с кейвордами - это KeyWordKeeper (ссылка на сайт автора), в простонародье KWK.

Программа умеет убирать дубли, делать выборки по признакам, делать выборки по признакам, и одновременно отсеивать исключения, может сделать выборку сразу по списку файлов, и записать это все в один, может разбить файл на файлы с определенным количеством строк, или же на определенное количество файлов. Одним словом, софтина умеет делать все что надо при работе с ключами.

Вторым делом, нам нужен парсер вордстата Яндекса - Магадан. Дал ссылку на сайт автора, т.к. яндекс периодически меняет алгоритмы, и старые версии могут работать неправильно. По сему качайте последние версии с оффсайта (благо автор обновляет софтину) и все будет ок.*

Дальше мы можем приступить к сборке ключей. Первый способ самый примитивный:

1. Запускаем магадан, добавляем наши ключевые слова, допустим, мы работаем с нишей лесбиянок:

- лесбиянки

- лезбиянки

- лесби

- лезби

ну и так далее.

Выбираем нужные нам опции для сохранения ключевиков, и запускаем дьявольскую машинку. Сразу предупреждаю, лучше изначально поставить время ожидания побольше и попить чая\пива в ожидании результата, чем наблюдать ошибки.

Дальше засовываем полученный результат в KWK, и начинаем работать над очисткой кеев.

Первым делом исключаем дубли.

Затем убираем ненужные кеи, т.е. те, которые не сконвертятся:

- бесплатно

- безплатно

- без смс

- без регистрации

После того, как отсеяли любителей халявы, самое время избавиться от читателей-вольнодумцев порнорассказов:

- рассказ

- расказ

- история

Дальше настало время избавиться от любителей статики и обладателей диал-ап интернета, т.е. чистим кеи от фото-тематики:

- фото

- фотки

- картинки

и так далее.

**Затем последний этап - чистим от уголовщины:

- зоо

- некро

- 11

- 12

- …

- 17

Ну, возможно еще чего-то найдете там, глазами можно быстро пролистать и глянуть, может я чего-то забыл.

Ну, в принципе, можно считать что тематическая база у вас есть. Также не стоит забывать, что, если вы делаете выборку, например, по слову “анал”, то вам придется чистить базу от всякого мусора типа “спутниковые каналы” “телеканал” “аналитика” и прочее. Иногда и такое попадается… Это обычно приходит из колонки “что еще искали со словом”.

Второй способ более изощренный и быстрый:

Находим в паблике (или не в паблике) большие микс базы, которые выложили из-за того, что “в них много мусора”, и засовываем в KWK. Делаем из них одну большую, и называем ее source.txt (просто я так делаю, можете как хотите назвать), т.е. источник.

Допустим, вам надо сделать выборку по нише, опять таки, лесби.

***Загружаем наш источник. В фильтрах ставим:

- лесби

- лезби

Далее открываем полученный файл, и теперь его прогоняем по фильтрам:

- скачать

- смотреть

- видео

- онлайн

- online

И так далее.

Есть еще третий способ, самый быстрый и самый эффективный, но его палить не буду, разве что только активным рефам :)

Ну, собственно все,  если у вас есть желание работать - этих двух методов вам хватит с головой :)

* - На сайте автора указаны требования к софту. Такие как дотнет 2.0 (минимум) и тому подобное. Дублировать тут не стал по понятным причинам. Пожалуйста, не игнорируйте их, что б потом не возникали лишние трудности при работе с софтом.

** - Эти кеи противоречат УК. Если вам глубоко плевать, или считаете что вас не достанут, то владельцы партнерок так не думают, и если что-то вдруг случится - то ##ать  в первую очередь будут их. Поэтому, если вы к ним будете лить траф по этим ключам - вас забанят и оставят без выплат.

*** - Заметьте, что я не написал полную версию ключей, а только корень, т.к. KWK ищет не совпадение слов, а символов. В некоторых случаях это облегчает работу, в некоторых затрудняет. Вроде, в новых версиях автор обещал сделать сделать эту функцию опционально, ну, а пока что пользуемся тем, что имеем.

Подписывайтесь на rss! Далее я напишу еще несколько статей для новичков, а дальше будем обсуждать более значимые темы для дорвейщиков. Не пропустите ;)

P.S. Для обмена постовыми пишите мне в аську. Все сделаем в лучшем виде :) До новых встреч :)

UPDATE: Забыл добавить, что при сборе кеев магаданом (да иногда и в мусорных базах) попадаются запросы, которые использовались при сборе баз для спама (при парсинге довольно часто используются оператор inurl, а так же различные слова свойственные определенным движкам: forum, reply и т.д.)

В хороших базах вы этого не найдете, но на все же будет полезно иметь под рукой такой список стоп-слов для очистки кеев.