doverennost uvolnenie harakteristika rezyume raznoe otzyv prikaz akt zayavlenie jaloba polojenie soglashenie isk pretenziya dokument postanovlenie pismo

Парсер контента.

9 Июнь 2010

Еще одна софтина которая поможет нашему ГСстроительству – Alpha Parser. Софт  представляет из себя скоростной парсер контента из блогов, для последующего массового импорта в различные CMS.

Как обычно хороший софт – платный сотф, но в принципе демо версия тоже хороша собой. Покопавшись в настройках можно на выходе получить удобный html файл. Затем надо этот файл закинуть в Word и очистить от ссылок, которые туда понаставил парсер (неплохо создатель софтины постарался).

Начнем с настроек:

  • Формат экспорта – ставим: html, один файл.
  • Ставим галочку на “убрать тэги”, по крайней мере контент чище будет, хоть и без рисунков.
  • Можно поставить галку “перемешивать текст”, хоть не чистый копи-паст будет.
  • Длина текста – минимум лучше ставить от 500, чем выше порог тем меньше мусора напарсится.

С настройками вроде все. Далее указываем нужный нам запрос или категорию, в общем – кому что нужно. Жмем кнопку “Старт”. С учетом того, что это демо версия Alpha Parser’а, придется пару раз потыкать на выскакивающее окошко, с предупреждением об ограничении напарсенных постов в сутки.

На выходе получаем файлец, как писалось выше, пихаем его в MS Word, быстренько удаляем ссылочки которыми нас “отблагодарил” парсер. Далее сохраняем это дело в html файл и пользуемся еще одной програмкой – textKitt, о которой уже рассказывал в прошлых постах. Дальше пару кликов и полученный контент красиво появляется каждый день на нашем очередном ГС.