Doplnok analýzy. Voľný analyzátor obsahu - AftParser

Existuje pomerne veľa oblastí činnosti, v ktorých sa dá syntaktický analyzátor použiť, ale predovšetkým je to zber rôznych informácií. Obrázky a odkazy môžete rýchlo zbierať iba programovo. Použitie syntaktického analyzátora na vyhľadávanie informácií vám umožňuje automatizovať tento proces, čo výrazne šetrí čas. Ak máte webovú stránku na Wordpresse, môžete ju jednoducho automaticky vyplniť pomocou analyzátora AftParser.

je bezplatný univerzálny analyzátor pre WordPress. umožňuje zhromažďovať obsah z jedného alebo rôznych zdrojov a spracovávať ho do požadovaného formátu v PHP. Analyzátor je vytvorený ako doplnok pre WordPress. Po normálnej inštalácii doplnku sa v konzole WordPress zobrazí ponuka syntaktického analyzátora, ako na obrázku.

Syntaktický analyzátor implementuje dva hlavné nástroje: analyzátor stránok WordPress a analyzátor rss Wordpress.

Parser pre WordPress môže:

1. Analyzuje údaje z odkazov

Stačí uviesť odkazy na zdroj. Ak neexistujú žiadne odkazy, môže ich zhromaždiť analyzátor. Zadajte cestu k mape lokality a grabber zhromaždí všetky odkazy. Alebo môžete zbierať odkazy z akejkoľvek html stránky. Odkazy je možné filtrovať podľa požadovaných kritérií. Existujú dva filtre odkazov, pomocou ktorých môžete zmeniť podmienky analýzy. Skúsení používatelia môžu vytvárať makrá analýzy sami, vďaka čomu je syntaktický analyzátor veľmi flexibilný, aby vyhovoval ich potrebám.

2. Analyzuje údaje informačného kanála RSS

Všetko je tu jednoduché, zadajte požadovanú adresu URL informačného kanála a kliknite na tlačidlo Začať analýzu.
Jedným z možných použití analyzátora wordpress je vypĺňanie stĺpcov správ na vašej webovej lokalite pomocou informačných zdrojov, ako sú blogy, RSS kanály s, stránky VKontakte atď. Konkurenti - WP-O-Matic, FeedWordPress, CyberSyn.

Niekedy nemá zmysel tráviť čas písaním textu pre web WordPress sami. Tento prípad sa netýka blogov a informačných stránok, pretože ich príjem je generovaný práve vďaka uverejneným príspevkom.

A to hovoríme o internetových obchodoch, firemných weboch a spravodajských portáloch, ktoré nie sú určené pre organickú návštevnosť. Pre takéto zdroje nie sú jedinečné materiály tak dôležité, ako ich neustála aktualizácia.

Ak chcete vytvoriť web s automatickým dopĺňaním, budete musieť pre svoj projekt nastaviť analyzátor správ. Najprv musíte nájsť vhodné lokality, z ktorých budete škrabať. Musia zodpovedať téme vášho projektu, inak nemá zmysel z nich duplikovať informácie. Ak je to tak, musíte prejsť k druhej časti riešenia problému analýzy - takto budete klonovať text z inej lokality. Najprimitívnejšou a najnepohodlnejšou metódou je manuálne kopírovanie. Je však oveľa múdrejšie použiť jeden z doplnkov uvedených v tomto článku na aktiváciu úspešného analyzátora správ a obsahu.

WP-O-Matic

Veľmi obľúbený modul pre WordPress, ktorý vám umožní nastaviť funkčný analyzátor správ z iných stránok. Nástroj je nainštalovaný pomocou jednoduchým spôsobom: buď cez nahrávanie priamo do priečinka na hostingu, alebo cez záložku “Pluginy”.

Ďalej musíte nakonfigurovať doplnok, ak chcete zabezpečiť analýzu obsahu. Ak to chcete urobiť, kliknite štyrikrát na „Ďalej“ a na konci na „Odoslať“. Týmto potvrdzujete svoj súhlas s podmienkami používania tohto modulu WordPress. Predovšetkým súhlasíte s tým, že iba vy ste zodpovedný za krádež materiálov iných ľudí, obsahu z iných stránok atď.

Ak vás okrem textovej zložky zaujímajú aj obrázky, tak si v priečinku s pluginom musíte vytvoriť adresár s názvom Cache. Nastavte špeciálne prístupové práva k tomuto priečinku. Ďalej sa budete musieť vrátiť do oblasti správy WordPress. Prejdite do nastavení doplnku a pozorne skontrolujte, či je vedľa položky Unix cron začiarknuté. Musíte začiarknuť políčko Cache Image, aby analyzátor správ kopíroval obrázky do vášho zdroja.

Modul WP-O-Matic je dobrý, pretože funguje na akejkoľvek stránke webu. Môžete pridať samostatnú kategóriu, ak chcete, aby sa tam zobrazoval zoznam noviniek a obsahu poskytovaného analyzátorom. Ak to chcete urobiť, najprv vytvorte potrebnú kategóriu. Potom v správcovi WordPress v nastaveniach nástroja WP-O-Matic kliknite na Pridať kampaň. V riadku Kategórie začiarknite špeciálnu kategóriu, ktorú ste vytvorili. A do formulára Informačné kanály zadajte informačný kanál RSS, ktorý sa chystáte analyzovať. Môžete zadať niekoľko adries URL pre informačné kanály naraz, takže analyzátor textu zbiera informácie z troch alebo dokonca štyroch zdrojov naraz.

A ďalšie obrovské plus v smere pluginu WP-O-Matic je automatické zverejňovanie materiálu. Ak chcete zmeniť stav svojich príspevkov na „Publikované“, nemusíte sa každú hodinu prihlasovať do svojho správcu WordPress. Modul to urobí sám. A ak si budete priať, dokáže text jedinečne upraviť pomocou špeciálneho mechanizmu synonymizácie. Toto je kľúčový rozdiel medzi týmto nástrojom a jeho konkurentom – doplnkom FeedWordPress.

Datacol

Ide o funkčný grabber, ktorý je vhodný nielen pre WordPress engine. Toto nie je len textový analyzátor pre webové stránky – je to tak inteligentná aplikácia, ktorá umožňuje filtrovať skopírovaný materiál. Napríklad budete môcť uverejňovať iba články, ktoré obsahujú určité Kľúčové slová. Správy môžete duplikovať priamo z Yandexu. Klonované materiály budú exportované v jednom z 15 dostupných formátov. Služba bude zbierať nielen text, ale aj titulky, fotografie, dátum zverejnenia, odkazy a ďalšie dôležité údaje.

Ale Datacol je distribuovaný na platenom základe. Je to však oveľa lacnejšie, ako keby ste si materiál na stránku objednávali cez burzy. Aplikácia stojí menej ako 500 rubľov a môže byť použitá pre takmer akýkoľvek motor. Existuje demo verzia.

Grabber FDE

Ďalší platený analyzátor s Vysoké číslo funkcie. Toto už patrí do kategórie drahých chmatákov, keďže bude stáť asi 90 dolárov. Bude ho však možné použiť na 10 serveroch naraz, to znamená, že teoreticky môžu rôzni webmasteri načipovať 9 dolárov, čím sa nákup zlacní.

FDE Grabber nie je presne doplnok WordPress. Vývojári nazývajú svoj výtvor ako autonómny systém, ktorý funguje bez ohľadu na typ CMS nainštalovaného na stránke. Hlavné vlastnosti tohto systému analýzy:

  • sťahovanie úplných správ alebo jednotlivých fragmentov;
  • môžete naplánovať publikácie;
  • ak chcete duplicitný materiál ozvláštniť, je tu zabudovaná funkcia synonymizácie;
  • môžete pracovať cez proxy servery;
  • parsovanie dokáže obísť presmerovania, čo môže byť problém pre iné pluginy;
  • môžete si automaticky stiahnuť všetok obsah zo stránky a presunúť ho na svoju stránku (ak ide o nespravodajské portály);

Parsovanie môžete nastaviť úplne podľa vlastného uváženia, pretože program má schopnosť implementovať mikroprogramy na opravu práce. Týmto spôsobom môžete napríklad nakonfigurovať prvky zarovnania a dizajnu kopírovaného materiálu. Môžete tiež pridať parametre noindex a nofollow pre všetky odkazy, ktoré budú v texte stránky. Analyzátor dokonca umožňuje kopírovať a automaticky prekladať články zo zahraničných zdrojov. Toto skvelý spôsob vytvorte na svojich stránkach neustály prúd obsahu, ktorý časom začne priťahovať návštevníkov!

Celkom výkonný univerzálny analyzátor pre WordPress. Umožňuje zhromažďovať obsah z jedného alebo viacerých zdrojov a spracovávať ho, pričom ho prispôsobuje požadovanému formátu pomocou všetkých možností jazyka PHP. Existuje možnosť oneskorenej analýzy. Najlepší bezplatný analyzátor pre wordpress v súčasnosti - AftParser je vždy k vašim službám!

Stručný popis funkčnosti:

Analyzátor pozostáva zo 4 stránok: domovská stránka, stránka analyzátora odkazov, stránka analyzátora kanála RSS a stránka nastavení. Takto to bude vyzerať po inštalácii:

Pozor: Môžete si prečítať, ako nakonfigurovať AftParser.

Začnime s domovskej stránke. Zobrazuje zoznam aktuálne spustených analyzátorov.

Vysvetlenia sú uvedené v blokoch na každej strane. Všetka dokumentácia je vybalená z krabice, len si ju pozorne prečítajte, aby bolo všetko jasné.

Analyzátor webových stránok:

Stránka analyzátora lokality vám umožňuje analyzovať údaje z jedného alebo viacerých zdrojov. Stačí poskytnúť odkazy na materiály.

Čo? Ste leniví prehľadávať web a zbierať materiály ručne? Nezúfajte – všetko je automatizované.

Existujú dva nástroje, ktoré vám umožňujú automaticky vyplniť zoznam odkazov.

- druh emulácie vyhľadávač. Robot bude sám prechádzať stránkami webu, ktoré sú naň prenesené, a zbierať z nich všetky interné odkazy.

Prirodzene, zoznam odkazov naplnených automatickými algoritmami bude silne zanesený nepotrebnými údajmi. A tu vám pomôžu filtre.

- najjednoduchšie a rýchly spôsob filtrácia. Zadáte podmienky a filter vykoná samotné spracovanie.

Pokročilý filter odkazov- filter odkazov, ktorý vám umožňuje meniť ich obsah a robiť množstvo ďalších rôznych vecí. Len pre skúsených používateľov. Radím vám, aby ste sa naučili php predtým, ako tam niečo urobíte.

Ak ste dokončili zhromažďovanie odkazov, ďalším krokom je pridanie hraníc obsahu.

Pomocou týchto hraníc syntaktický analyzátor určí oblasti, ktoré je potrebné spracovať.

Zvýraznenie syntaxe je implementované pomocou javascriptového editora ACE. Všetka dokumentácia a všetky dostupné funkcie sú uvedené na stránke pluginu. Zoznam je veľmi pôsobivý a nemôžem ho tu predstaviť, pretože tento materiál je už veľmi dlhý. Stačí nainštalovať plugin a čítať, budete ohromení, to vám garantujem.

Takto vyzerá stránka Analyzátor RSS kanálov, len s tým rozdielom, že nie je potrebné uvádzať zoznamy odkazov.

Predstavujem vám univerzálny WordPress grabber WP UniParser. Tento plugin je univerzálny prispôsobiteľný parser. Pri vytváraní príspevkov môže plugin prekladať obsah cez služby Google Prekladajte pomocou ľubovoľných jazykových párov.

Hodnotenia zákazníkov

Tému na serveri, kde bolo asi 6-7 recenzií, moderátori zmazali (tvrdia, že produkt nespĺňa pravidlá fóra). Napriek tomu si jednu recenziu môžete prečítať na fóre Mulnet a Armade. Sú tu aj recenzie od blogerov: tu a tu. Pomerne nedávno som náhodou natrafil na recenziu.

Základná funkčnosť

Doplnok WP UniParser, ktorý som vytvoril, dokáže:
vytiahnuť obsah z stránky na akýchkoľvek motoroch(parser sa konfiguruje pomocou regulárnych výrazov a obmedzovacích reťazcov, nastavenie je veľmi jednoduché, všetko vysvetlím a ukážem, navyše je na to odkaz);
vystrihnúť skripty, komentáre, odkazy, formuláre, obrázky, rozsahy, objekty, ako aj akékoľvek fragmenty, ktoré určíte z obsahu.
zverejnenie plánu príspevky;
vložte analyzované materiály do kategórie, ktorú definujete (alebo ich náhodne rozdeľte do kategórií);
realizovať automatický preklad(v ľubovoľnom smere) vo všetkých jazykoch podporovaných službou Google Translate.

Viac o sade funkcií doplnku sa dozviete na snímke jeho administračného panela:

Tiež stojí za to plne porozumieť fungovaniu univerzálneho drapáka.

Analyzátor pre WordPress je nastavenie Datacol určené na zhromažďovanie obsahu (novinky, články, recenzie atď.) s ďalším exportom do CMS WordPress.

V tomto príklade sa výsledný obsah exportuje do . Výsledky každého príspevku sa uložia do samostatného súboru, ktorého názov sa vygeneruje na základe názvu príspevku a obsah sa vygeneruje na základe analyzovaných informácií. Môžete tiež nastaviť priamy export do blogu WordPress. Ako to urobiť, je uvedené vo videu.

Parser pre WordPress si môžete zadarmo otestovať v demo verzii programu.
Hlavné výhody analyzátora založeného na Datacol pre WordPress sú:

  • Schopnosť prispôsobiť analýzu pre WordPress špecificky tak, aby vyhovovala vašim potrebám (vami alebo).
  • Možnosť ďalej spracovávať zozbierané dáta pomocou pluginov a tiež ich načítať do .
  • Možnosť cyklického spúšťania kampaní. Keď výsledky prvej úlohy analýzy budú vstupom do druhej úlohy zberu údajov. Čítaj viac.

Ako sa používa analyzátor pre WordPress?

Ak ste si vytvorili blog, po určitom čase vám bude jasné, že na jeho propagáciu je neustále potrebný nový jedinečný obsah. A stanete sa príliš leniví na to, aby ste sami písali články a vyplnili stránky ručne. Ale kde to môžem získať? nový obsah? Skôr či neskôr príde čas, keď sa budete chcieť uchýliť k autoblogovaniu. Jednoducho povedané, použite analyzátor, ktorý sám zverejní informácie, ktoré potrebujeme. S touto úlohou nám pomôže analyzátor obsahu pre WordPress.

Všetky webové stránky boli v určitom okamihu vytvorené úplne od začiatku. Ale ak je cieľom vašej stránky poskytovať informácie, stane sa zaujímavou až vtedy, keď množstvo informácií presiahne určité množstvo. Parser blogov WordPress je vynikajúcim riešením pre takúto úlohu. S jeho pomocou môžete krátky čas dobehnúť konkurentov výrazným rozšírením katalógu informácií na stránke. Parser WordPress môže byť implementovaný ako grabber pre WordPress z konkrétneho webu.

Analyzátor pre WordPress blog môže pomôcť pri riešení mnohých problémov, tu sú niektoré z nich:
— počiatočné naplnenie zdroja (analyzátor stránok pre WordPress vám umožní naplniť váš blog informáciami od začiatku až po požadovaný objem v čo najkratšom čase);
— vytvorenie automaticky vyplneného blogu (parser WordPress bude schopný zabezpečiť pravidelnú automatickú aktualizáciu obsahu stránky)
— publikovanie obsahu „podľa plánu“ (môžete si naplánovať čas na pridávanie príspevkov na vašu stránku)

Hromadné uverejňovanie vo WordPress

Analyzátor pre WordPress prezentovaný v Datacol je jasný príklad pomocou syntaktického analyzátora na hromadné odosielanie. Umožňuje vám automaticky prijímať obsah a publikovať ho na svojom blogu. Proces zoškrabovania WordPress možno rozdeliť do niekoľkých etáp:

1) Proces zhromažďovania obsahu. Parser WordPress zhromažďuje potrebné informácie pre každý blogový príspevok: názov, obsah (stiahnutý s obrázkami, ktoré sa uložia do vášho počítača na ďalšie stiahnutie cez FTP na váš server), kategóriu, autora a odkaz, z ktorého boli údaje zhromaždené (URL).

2) Ukladanie informácií zhromaždených analyzátorom pre WordPress. Po analýze sa zhromaždené informácie uložia TXT súbory(každý príspevok je uložený v samostatnom textovom súbore), ktorého názvy sú generované v súlade s názvom príspevku.

3) Exportujte WordPress. Analyzované informácie je tiež možné priamo exportovať do vášho blogu WordPress. Vďaka tomu je proces plnenia veľmi rýchly a eliminuje sa možnosť ľudských chýb. Možnosť exportu do WordPressu je súčasťou základnej funkcionality programu. V nastaveniach programu musíte špecifikovať parametre pripojenia k vášmu blogu a špecifikovať údaje, ktoré sa majú exportovať (názov, obsah, kategória atď.)

4) Spracovanie informácií. V prípade potreby môžu byť informácie zhromaždené počas procesu analýzy WordPress spracované (napríklad podrobené automatickému prekladu alebo synonymizácii). Tieto funkcie sú implementované pomocou pluginov.

Ako analyzovať web WordPress?

Vo WordPresse môžete analyzované informácie nielen publikovať, ale môžete ich z neho aj zoškrabať. Úloha používať WordPress blogy iných ľudí ako zdroj obsahu pre vaše blogy vzniká pomerne často. Na vyriešenie tohto problému vám pomôže analyzátor stránok WordPress. Algoritmus na prácu s analyzátorom stránok WordPress je podobný tomu, ktorý je opísaný vyššie.

Výhody analyzátora webových stránok WordPress

Pravdepodobne ste už presvedčení, že analyzátor blogu WordPress vám pomôže netráviť veľa času a úsilia manuálnym vypĺňaním blogu. Vďaka nemu môžete svoju prácu nielen zautomatizovať, ale aj zvýšiť jej efektivitu. Parser pre WordPress, implementovaný v rámci Datacol, si môžete stiahnuť na adrese

Testovanie analyzátora blogu

Ak chcete otestovať analyzátor blogu:

Krok 2. Strom kampane obsahuje kampaň content-parsers/kolchaka-net.par. Vyberte ho a kliknite na tlačidlo Prehrať. Pred spustením môžete upraviť vstupné údaje. Týmto spôsobom môžete nastaviť odkaz na blog alebo stránky blogu, z ktorých budete analyzovať obsah.

Krok 3. Počkajte, kým sa zobrazia výsledky analýzy blogu. Po zobrazení výsledkov môžete analýzu násilne zastaviť (kliknutím na tlačidlo Zastaviť).

pre zväčšenie kliknite na obrázok

Krok 4. Po dokončení/nútenom zastavení syntaktického analyzátora v priečinku Moje dokumenty nájdete textové súbory(každý príspevok je uložený v samostatnom súbore), ktorého názvy sú generované na základe názvov príspevkov:

pre zväčšenie kliknite na obrázok

Publikácie na danú tému