Плъгин за анализиране. Безплатен анализатор на съдържание - AftParser

Има доста области на дейност, в които може да се използва парсер, но основно това е събирането на различна информация. Можете бързо да събирате снимки и връзки само програмно. Използването на анализатор за търсене на информация ви позволява да автоматизирате този процес, като значително спестявате време. Ако имате уебсайт в Wordpress, можете лесно да го направите автоматично попълван с помощта на парсера AftParser.

е безплатен, универсален парсер за WordPress. ви позволява да събирате съдържание от един или различни източници, обработвайки го в желания формат в PHP. Парсерът е направен като плъгин за WordPress. След като инсталирате плъгина нормално, в конзолата на WordPress ще се появи меню за анализатор, както е на снимката.

Анализаторът имплементира два основни инструмента: парсерът на сайта WordPress и rss анализаторът на Wordpress.

Анализаторът за WordPress може:

1. Анализира данни от връзки

Трябва само да предоставите връзки към източника. Ако няма връзки, те могат да бъдат събрани от анализатор. Посочете пътя до картата на сайта и граберът ще събере всички връзки. Или можете да събирате връзки от всяка html страница. Връзките могат да бъдат филтрирани по желани критерии. Има два филтъра за връзки, с които можете да промените условията за анализ. Опитните потребители могат сами да създават макроси за анализиране, което прави анализатора много гъвкав, за да отговаря на техните нужди.

2. Анализира данните за RSS емисии

Тук всичко е просто, въведете желания URL адрес на емисия и щракнете върху начало на анализиране.
Една от възможните употреби на анализатора на wordpress е попълването на колони с новини на вашия уебсайт с помощта на източници на информация като блогове, rss емисии s, страници на VKontakte и др. Конкуренти - WP-O-Matic, FeedWordPress, CyberSyn.

Понякога няма смисъл сами да отделяте време за писане на текст за WordPress сайт. Този случай не се отнася за блогове и информационни сайтове, тъй като доходите им се генерират именно благодарение на публикуваните публикации.

И говорим за онлайн магазини, фирмени уебсайтове и новинарски портали, които не са предназначени за органичен трафик. За такива ресурси уникалните материали не са толкова важни, колкото постоянното им актуализиране.

За да направите сайт за автоматично попълване, ще трябва да настроите анализатор на новини за вашия проект. Първо трябва да намерите подходящи сайтове, от които ще изгребвате. Те трябва да отговарят на темата на вашия проект, в противен случай няма смисъл да дублирате информация от тях. Ако случаят е такъв, тогава трябва да преминете към втората част от решението на проблема с парсинга - така ще клонирате текст от друг сайт. Най-примитивният и неудобен метод е ръчното копиране. Но е много по-разумно да използвате един от плъгините, дадени в тази статия, за да активирате успешен анализатор на новини и съдържание.

WP-O-Matic

Много популярен модул за WordPress, който ще ви позволи да настроите функционален анализатор на новини от други сайтове. Инструментът е инсталиран от по прост начин: или чрез качване директно в папка на хостинга, или през раздела „Plugins“.

След това трябва да конфигурирате приставката, ако искате да осигурите анализ на съдържанието. За да направите това, просто щракнете четири пъти върху „Напред“ и накрая върху „Изпращане“. По този начин вие потвърждавате съгласието си с условията за използване на този WordPress модул. По-специално, вие се съгласявате, че само вие носите отговорност за кражбата на материали на други хора, съдържание от други сайтове и т.н.

Ако в допълнение към текстовия компонент се интересувате и от снимки, тогава трябва да създадете директория, наречена Cache, в папката с плъгина. Задайте специални права за достъп до тази папка. След това ще трябва да се върнете в административната област на WordPress. Отидете в настройките на плъгина и внимателно вижте дали има отметка до елемента cron на Unix. Трябва да поставите положителна отметка в полето Cache Image, така че анализаторът на новини също да копира изображения във вашия ресурс.

Модулът WP-O-Matic е добър, защото работи на всяка страница на сайта. Можете да добавите отделна категория, ако искате списъкът с новини и съдържание, предоставени от анализатора, да се показва там. За да направите това, първо създайте необходимата категория. След това в администратора на WordPress в настройките на инструмента WP-O-Matic щракнете върху Добавяне на кампания. В реда Категории проверете специалната категория, която сте създали. И във формуляра Feeds въведете RSS емисията, която ще анализирате. Можете да въведете няколко URL адреса за емисии наведнъж, така че текстовият анализатор да събира информация от три или дори четири ресурса наведнъж.

И още един огромен плюс в посока на плъгина WP-O-Matic е автоматичното публикуване на материал. Не е нужно да влизате във вашия администратор на WordPress всеки час, за да промените статуса на вашите публикации на „Публикувано“. Модулът ще направи това сам. И ако желаете, може да уникализира текста чрез специален механизъм за синонимизация. Това е основната разлика между този инструмент и неговия конкурент – приставката FeedWordPress.

Datacol

Това е функционален грабер, който е подходящ не само за WordPress двигателя. Това не е просто анализатор на текст за страници на уебсайтове - това е интелигентно приложение, което ви позволява да филтрирате копирания материал. Например, ще можете да публикувате само статии, които съдържат определени ключови думи. Можете да дублирате новини директно от Yandex. Клонираните материали ще бъдат експортирани в един от 15 налични формата. Услугата ще събира не само текст, но и заглавия, снимки, дата на публикуване, връзки и други важни данни.

Но Datacol се разпространява на платена основа. Въпреки това е много по-евтино, отколкото ако сте поръчали материал за сайта чрез обмен. Приложението струва по-малко от 500 рубли и може да се използва за почти всеки двигател. Има демо версия.

FDE грайфер

Друг платен анализатор с Голям бройфункции. Това вече е в категорията на скъпите грайфери, тъй като ще струва около $90. Но ще бъде възможно да го използвате на 10 сървъра наведнъж, т.е. на теория различни уебмастъри могат да платят $9, като по този начин направят покупката по-евтина.

FDE Grabber не е точно плъгин за WordPress. Разработчиците наричат ​​своето творение автономна система, която работи независимо от типа CMS, инсталиран на сайта. Основните характеристики на тази система за анализ:

  • изтегляне на новини в пълен мащаб или отделни фрагменти;
  • можете да планирате публикации;
  • ако искате да уникализирате дублирания материал, има вградена функция за синонимизиране;
  • можете да работите чрез прокси сървъри;
  • анализирането може да заобиколи пренасочванията, което може да бъде проблем за други добавки;
  • можете автоматично да изтеглите цялото съдържание от сайта и да го преместите на вашия сайт (ако се отнася за портали без новини);

Можете да настроите анализирането изцяло по свое усмотрение, тъй като програмата има способността да внедрява микропрограми за коригиране на работата. Например, по този начин можете да конфигурирате подравняването и характеристиките на дизайна на копирания материал. Можете също така да добавите параметри noindex и nofollow за всички връзки, които ще бъдат в текста на страницата. Анализаторът дори ви позволява да копирате и автоматично превеждате статии от чужди ресурси. Това страхотен начинсъздайте постоянен поток от съдържание на вашите страници, който ще започне да привлича посетители с течение на времето!

Доста мощен универсален парсер за WordPress. Позволява ви да събирате съдържание от един или повече източници и да го обработвате, адаптирайки го към необходимия формат, като използвате всички възможности на езика PHP. Има възможност за забавен анализ. Най-добрият безплатен парсер за wordpress в момента - AftParser е винаги на ваше разположение!

Кратко описание на функционалността:

Анализаторът се състои от 4 страници: начална страница, страница за анализатор на връзки, страница за анализатор на RSS емисии и страница с настройки. Ето как ще изглежда след инсталацията:

Внимание:Можете да прочетете как да конфигурирате AftParser.

Да започнем с начална страница. Той показва списък на изпълняваните в момента анализатори.

Обясненията са предоставени в блокове на всяка страница. Цялата документация идва от кутията; просто я прочетете внимателно, за да стане всичко ясно.

Анализатор на уебсайтове:

Страницата за анализатор на сайта ви позволява да анализирате данни както от един, така и от множество източници. Трябва само да предоставите връзки към материалите.

Какво? Твърде мързеливи сте да ровите в мрежата и да събирате материали на ръка? Не се отчайвайте - всичко е автоматизирано.

Има два инструмента, които ви позволяват да попълвате списъка си с връзки автоматично.

- вид емулация търсачка. Роботът сам ще премине през прехвърлените към него страници на сайта и ще събере всички вътрешни връзки от тях.

Естествено, списък с връзки, попълнен с автоматични алгоритми, ще бъде силно задръстен с ненужни данни. И тук на помощ идват филтрите.

- най-простият и бърз начинфилтриране. Въвеждате условията и филтърът сам извършва обработката.

Разширен филтър за връзки- филтър за връзки, който ви позволява да променяте тяхното съдържание и да правите куп други различни неща. Само за опитни потребители. Съветвам ви да научите php, преди да правите нещо там.

Ако сте завършили събирането на връзки, следващата стъпка е да добавите граници на съдържанието.

Използвайки тези граници, анализаторът ще определи областите, които трябва да бъдат обработени.

Осветяването на синтаксиса се реализира с помощта на редактора на JavaScript ACE. Цялата документация и всички налични функции са предоставени на страницата на приставката. Списъкът е много впечатляващ и не мога да го представя тук, тъй като този материал вече е много дълъг. Просто инсталирайте плъгина и прочетете, ще останете впечатлени, гарантирам го.

Ето как изглежда страницата Анализатор на RSS емисии, с единствената разлика, че няма изискване за предоставяне на списъци с връзки.

Представям ви универсалното Грабър на WordPress WP UniParser. Този плъгин е универсален персонализиран парсер. Когато създавате публикации, плъгинът може да превежда съдържание чрез Google услугаПревеждайте с помощта на всякакви езикови двойки.

Отзиви на клиенти

Темата на сървъра, където имаше около 6-7 рецензии, беше изтрита от модераторите (твърдят, че продуктът не отговаря на правилата на форума). Въпреки това, един преглед може да се прочете във форума на Mulnet и Armada. Има и отзиви от блогъри: тук и тук. Съвсем наскоро случайно попаднах на преглед.

Основна функционалност

Приставката WP UniParser, която създадох, може да направи следното:
изтегляне на съдържание от сайтове на всякакви двигатели(парсерът е конфигуриран с помощта на регулярни изрази и ограничителни низове, настройката е много проста, ще обясня и покажа всичко, освен това има връзка към него);
изрязване на скриптове, коментари, връзки, формуляри, картини, обхвати, обекти, както и всякакви фрагменти, които посочите от съдържанието.
публикуване на планпостове;
поставете анализираните материали в категория, която дефинирате (или произволно ги разпределете в категории);
осъзнавам автоматичен превод(във всяка посока) на всички езици, поддържани от Google Translate.

Можете да научите повече за набора от функции на плъгина в екранната снимка на неговия админ панел:

Също така си струва да разберете напълно работата на универсалния грайфер.

Парсерът за WordPress е настройка на Datacol, предназначена да събира съдържание (новини, статии, рецензии и т.н.) с по-нататъшно експортиране към WordPress CMS.

В този пример полученото съдържание се експортира в . Резултатите за всяка публикация се записват в отделен файл, чието име се генерира въз основа на заглавието на публикацията, а съдържанието се генерира въз основа на анализираната информация. Можете също така да настроите директно експортиране към вашия WordPress блог. Как да направите това е показано във видеото.

Можете да тествате парсера за WordPress безплатно в демо версията на програмата.
Основните предимства на базирания на Datacol парсер за WordPress са:

  • Възможността за персонализиране на анализирането за WordPress специално, за да отговаря на вашите нужди (от вас или).
  • Възможността за допълнителна обработка на събраните данни с помощта на плъгини и зареждането им в .
  • Възможност за циклично стартиране на кампании. Когато резултатите от първата задача за анализиране ще бъдат вход за втората задача за събиране на данни. Прочетете още.

Как се използва парсерът за WordPress?

Ако сте създали блог, след известно време ви става ясно, че постоянно е необходимо ново уникално съдържание, за да го популяризирате. И ставате твърде мързеливи, за да пишете статии сами и да попълвате сайта ръчно. Но откъде мога да го взема? ново съдържание? Рано или късно идва моментът, когато искате да прибегнете до автоблогинг. Просто казано, използвайте анализатор, който сам ще публикува необходимата ни информация. Анализатор на съдържание за WordPress ще ни помогне да се справим с тази задача.

Всички уебсайтове в даден момент са били създадени от нулата. Но ако целта на вашия сайт е да предоставя информация, той ще стане интересен едва когато количеството информация надхвърли определено количество. Анализаторът на блога на WordPress е отлично решение за такава задача. С негова помощ можете кратко времеда настигнете конкурентите чрез значително разширяване на каталога с информация на сайта. Анализаторът на WordPress може да бъде внедрен като грабер за WordPress от конкретен сайт.

Парсер за WordPress блогможе да помогне при решаването на много проблеми, ето някои от тях:
— първоначално попълване на ресурса (парсер на сайта за WordPress ще ви позволи да попълните блога си с информация от нулата до необходимия обем за възможно най-кратко време);
— създаване на автоматично попълван блог (парсерът на WordPress ще може да осигури редовно автоматично актуализиране на съдържанието на сайта)
— публикуване на съдържание „по график“ (можете да планирате времето за добавяне на публикации към вашия сайт)

Групово публикуване в WordPress

Парсерът за WordPress, представен в Datacol, е ясен примеризползване на анализатор за масово публикуване. Тя ви позволява автоматично да получавате съдържание и да го публикувате във вашия блог. Процесът на изтриване на WordPress може да бъде разделен на няколко етапа:

1) Процесът на събиране на съдържание. Анализаторът на WordPress събира необходимата информация за всяка публикация в блога: заглавие, съдържание (изтеглено с изображения, които се записват на вашия компютър за по-нататъшно изтегляне чрез FTP на вашия сървър), категория, автор и връзка, от която са събрани данните (URL).

2) Запазване на информацията, събрана от парсера за WordPress. След анализиране събраната информация се запазва TXT файлове(всяка публикация се записва в отделен текстов файл), чиито имена се генерират в съответствие със заглавието на публикацията.

3) Експортирайте WordPress. Възможно е също така директно да експортирате анализирана информация във вашия WordPress блог. Това прави процеса на пълнене много бърз и елиминира възможността за човешки грешки. Възможността за експорт в WordPress е включена в основната функционалност на програмата. Трябва да посочите параметрите за свързване с вашия блог в настройките на програмата и да посочите данните, които да бъдат експортирани (заглавие, съдържание, категория и т.н.)

4) Обработка на информация. Ако желаете, информацията, събрана по време на процеса на анализ на WordPress, може да бъде обработена (например, подложена на автоматичен превод или синонимизация). Тези функции се реализират с помощта на добавки.

Как да анализирате WordPress сайт?

Можете не само да публикувате анализирана информация в WordPress, но можете също да я изтриете от него. Задачата да използвате WordPress блоговете на други хора като източник на съдържание за вашите блогове възниква доста често. За да разрешите този проблем, ще ви помогне анализатор на сайтове на WordPress. Алгоритъмът за работа с парсер на WordPress сайт е подобен на описания по-горе.

Предимства на анализатора на уебсайтове на WordPress

Вероятно вече сте убедени, че анализаторът на блогове на WordPress ще ви помогне да не харчите много време и усилия за ръчно попълване на вашия блог. Благодарение на него можете не само да автоматизирате работата си, но и да увеличите нейната ефективност. Можете да изтеглите парсера за WordPress, внедрен в Datacol, на адрес

Тестване на анализатора на блога

За да тествате анализатора на блога:

Стъпка 2. Дървото на кампанията съдържа кампанията content-parsers/kolchaka-net.par. Изберете го и щракнете върху бутона Възпроизвеждане. Преди да започнете, можете да редактирате входните данни. По този начин можете да зададете връзка към блога или страниците на блога, от които ще анализирате съдържанието.

Стъпка 3. Изчакайте да се появят резултатите от анализатора на блога. След като се появят резултатите, можете принудително да спрете анализирането (като щракнете върху бутона Стоп).

щракнете върху изображението за уголемяване

Стъпка 4. След завършване/принудително спиране на анализатора в папката My Documents можете да намерите текстови файлове(всяка публикация се записва в отделен файл), чиито имена се генерират въз основа на заглавията на публикациите:

щракнете върху изображението за уголемяване

Публикации по темата