пятница, 12 февраля 2010 г.

Обработка выдачи wordstat.yandex.ru при помощи небольшого скрипта на Ruby

На днях столкнулся с небольшой проблемой по обработке выдачи сервиса Wordstat от Yandex. То есть, при простом копировании ключевых фраз по Ctrl+C - Ctrl+V мы имеет файл такого вида:
====
Ключевая фраза1 23434
Ключевая +фраза2 5435
...
====
В данном случае, нам необходимо избавиться от заключительных числовых значений (количество запросов данной ключевой фразы в месяц), а также заодно убрать из строчных значений ключевых фраз символ "+". Если бы строк в выдаче было не очень много, можно было бы обойтись и ручным трудом, но, в любом случае, каждый понимает, что ручной труд - это плохо и негодно :) В общем, будем это дело автоматизировать. Попробуем написать небольшой скрипт на Ruby.