Parsing plugin. Gratis innehållstolk - AftParser

Det finns en hel del verksamhetsområden där en parser kan användas, men främst är det insamling av olika information. Du kan snabbt samla in bilder och länkar endast programmatiskt. Genom att använda en parser för att söka efter information kan du automatisera denna process, vilket avsevärt sparar tid. Om du har en webbplats på Wordpress kan du enkelt göra den automatiskt ifylld med AftParser-parsern.

är en gratis, universell parser för WordPress. låter dig samla in innehåll från en eller olika källor, bearbeta det till önskat format i PHP. Parsern är gjord som ett plugin för WordPress. Efter att ha installerat plugin normalt kommer en parsermeny att dyka upp i WordPress-konsolen, som på bilden.

Parsern implementerar två huvudverktyg: WordPress site parser och Wordpress rss parser.

Parser för WordPress kan:

1. Analyserar data från länkar

Du behöver bara ange länkar till källan. Om det inte finns några länkar kan de samlas in av en parser. Ange sökvägen till webbplatskartan så samlar grabbern alla länkar. Eller så kan du samla länkar från vilken HTML-sida som helst. Länkar kan filtreras enligt önskade kriterier. Det finns två länkfilter med vilka du kan ändra parsningsvillkoren. Erfarna användare kan själva skapa parsningsmakron, vilket gör parsern mycket flexibel för att passa deras behov.

2. Parsar RSS-flödesdata

Allt är enkelt här, ange önskad feed-URL och klicka på start parsing.
En av de möjliga användningsområdena för wordpress parser är att fylla nyhetskolumner på din webbplats med hjälp av informationskällor som bloggar, rss-flöden s, VKontakte-sidor, etc. Konkurrenter - WP-O-Matic, FeedWordPress, CyberSyn.

Ibland är det ingen idé att lägga tid på att skriva text till en WordPress-sajt själv. Det här fallet gäller inte bloggar och informationssajter, eftersom deras inkomster genereras just tack vare de postade inläggen.

Och vi pratar om nätbutiker, företagshemsidor och nyhetsportaler som inte är designade för organisk trafik. För sådana resurser är unika material inte lika viktigt som deras ständiga uppdatering.

För att skapa en webbplats för autofyll måste du konfigurera en nyhetstolkare för ditt projekt. Först måste du hitta lämpliga platser från vilka du ska skrapa. De måste motsvara ämnet för ditt projekt, annars är det ingen idé att duplicera information från dem. Om så är fallet måste du gå vidare till den andra delen av lösningen på analysproblemet - det är så här du kommer att klona text från en annan webbplats. Den mest primitiva och obekväma metoden är manuell kopiering. Men det är mycket klokare att använda ett av plugins som ges i den här artikeln för att aktivera en framgångsrik nyhets- och innehållstolk.

WP-O-Matic

En mycket populär modul för WordPress som låter dig ställa in en funktionell nyhetsparser från andra webbplatser. Verktyget installeras av på ett enkelt sätt: antingen genom att ladda upp direkt till en mapp på webbhotellet eller via fliken "Plugins".

Därefter måste du konfigurera plugin-programmet om du vill säkerställa innehållsanalys. För att göra detta klickar du bara på "Nästa" fyra gånger och i slutet på "Skicka". Således bekräftar du ditt samtycke till användarvillkoren för denna WordPress-modul. I synnerhet samtycker du till att du ensam är ansvarig för stöld av andras material, innehåll från andra webbplatser osv.

Om du förutom textkomponenten också är intresserad av bilder, måste du skapa en katalog som heter Cache i mappen med plugin. Ange särskilda åtkomsträttigheter till den här mappen. Därefter måste du återgå till WordPress-administratörsområdet. Gå till plugin-inställningarna och titta noga för att se om det finns en bock bredvid Unix cron-objektet. Du måste bekräfta rutan Cachebild så att nyhetstolkaren också kopierar bilder till din resurs.

WP-O-Matic-modulen är bra eftersom den fungerar på vilken sida som helst på webbplatsen. Du kan lägga till en separat kategori om du vill att listan över nyheter och innehåll som tillhandahålls av parsern ska visas där. För att göra detta, skapa först den nödvändiga kategorin. Sedan i WordPress admin i WP-O-Matic verktygsinställningar, klicka på Lägg till kampanj. På raden Kategorier kontrollerar du den specialkategori du skapade. Och i formuläret Flöden anger du RSS-flödet som du ska analysera. Du kan ange flera webbadresser för flöden samtidigt, så att texttolken samlar in information från tre eller till och med fyra resurser samtidigt.

Och ett annat stort plus i riktning mot WP-O-Matic-plugin är den automatiska publiceringen av material. Du behöver inte logga in på din WordPress-administratör varje timme för att ändra statusen för dina inlägg till "Publicerade". Modulen kommer att göra detta på egen hand. Och om du vill kan den unika texten genom en speciell synonymiseringsmekanism. Detta är den viktigaste skillnaden mellan det här verktyget och dess konkurrent – ​​FeedWordPress-plugin.

Datacol

Detta är en funktionell gripare som inte bara lämpar sig för WordPress-motorn. Detta är inte bara en texttolkare för webbsidor – det är det smart app, som låter dig filtrera det kopierade materialet. Till exempel kommer du bara att kunna posta artiklar som innehåller vissa nyckelord. Du kan duplicera nyheter direkt från Yandex. Klonat material kommer att exporteras i ett av 15 tillgängliga format. Tjänsten kommer att samla in inte bara text, utan även rubriker, fotografier, publiceringsdatum, länkar och annan viktig information.

Men Datacol distribueras på betalbasis. Det är dock mycket billigare än om du beställt material till sidan genom byten. Applikationen kostar mindre än 500 rubel och kan användas för nästan vilken motor som helst. Det finns en demoversion.

FDE Grabber

En annan betald parser med ett stort antal funktioner. Detta är redan i kategorin dyra grabbers, eftersom det kommer att kosta cirka $90. Men det kommer att vara möjligt att använda det på 10 servrar samtidigt, det vill säga i teorin kan olika webbansvariga chip in $9, vilket gör köpet billigare.

FDE Grabber är inte precis ett WordPress-plugin. Utvecklarna kallar sitt skapande för ett autonomt system som fungerar oavsett vilken typ av CMS som är installerat på sajten. Huvudfunktionerna i detta analyssystem:

  • nedladdning av fullskaliga nyheter eller enskilda fragment;
  • du kan schemalägga publikationer;
  • om du vill unika duplicerat material finns det en inbyggd synonymiseringsfunktion;
  • du kan arbeta via proxyservrar;
  • parsing kan kringgå omdirigeringar, vilket kan vara ett problem för andra plugins;
  • du kan automatiskt ladda ner allt innehåll från webbplatsen och flytta det till din webbplats (om det gäller icke-nyhetsportaler);

Du kan ställa in parsning helt efter eget gottfinnande, eftersom programmet har förmågan att implementera mikroprogram för att korrigera arbetet. På det här sättet kan du till exempel konfigurera inriktningen och designfunktionerna för det kopierade materialet. Du kan också lägga till noindex och nofollow parametrar för alla länkar som kommer att finnas i sidtexten. Parsern låter dig till och med kopiera och automatiskt översätta artiklar från utländska resurser. Detta bra väg skapa en konstant ström av innehåll på dina sidor som kommer att börja locka besökare med tiden!

En ganska kraftfull universell parser för WordPress. Låter dig samla in innehåll från en eller flera källor och bearbeta det, anpassa det till önskat format med alla funktioner i PHP-språket. Det finns en möjlighet till fördröjd analys. Den bästa gratis parsern för wordpress för tillfället - AftParser står alltid till din tjänst!

Kort beskrivning av funktionalitet:

Parsern består av 4 sidor: Hemsida, Länkparsersida, RSS-flödesparsersida och inställningssida. Så här kommer det att se ut efter installationen:

Uppmärksamhet: Du kan läsa hur du konfigurerar AftParser.

Låt oss börja med startsida. Den visar en lista över analyserare som körs för närvarande.

Förklaringar finns i block på varje sida. All dokumentation kommer ut ur kartongen, läs bara den noggrant för att göra allt klart.

Webbplatstolkare:

Webbplatsparsersidan låter dig analysera data från både en och flera källor. Du behöver bara tillhandahålla länkar till material.

Vad? För lat för att leta igenom nätet och samla material för hand? Misströsta inte – allt är automatiserat.

Det finns två verktyg som låter dig fylla din lista med länkar automatiskt.

- en sorts emulering sökmotor. Roboten kommer själv att gå igenom sidorna på webbplatsen som överförs till den och samla in alla interna länkar från dem.

Naturligtvis kommer en lista med länkar fylld med automatiska algoritmer att vara kraftigt igensatt med onödiga data. Och här kommer filter till din hjälp.

- den enklaste och snabbt sätt filtrering. Du anger villkoren och filtret utför själva bearbetningen.

Avancerat länkfilter- ett länkfilter som låter dig ändra deras innehåll och göra en massa andra olika saker. Bara för erfarna användare. Jag råder dig att lära dig php innan du gör något där.

Om du har slutfört länksamlingen är nästa steg att lägga till innehållsgränser.

Med hjälp av dessa gränser kommer analysatorn att bestämma de områden som behöver bearbetas.

Syntaxmarkering implementeras med javascript-redigeraren ACE. All dokumentation och alla tillgängliga funktioner finns på pluginsidan. Listan är mycket imponerande och jag kan inte presentera den här, eftersom detta material redan är väldigt långt. Installera bara plugin och läs, du kommer att bli imponerad, jag garanterar det.

Så här ser sidan ut RSS feed parser, med den enda skillnaden att det inte finns något krav på att tillhandahålla länklistor.

Jag presenterar det universella för dig WordPress grabber WP UniParser. Detta plugin är universell anpassningsbar parser. När du skapar inlägg kan plugin översätta innehåll via Google-tjänstÖversätt med valfritt språkpar.

Recensioner

Ämnet på servern, där det fanns cirka 6-7 recensioner, togs bort av moderatorer (de säger att produkten inte uppfyller forumreglerna). Ändå kan en recension läsas på Mulnet-forumet och Armada. Det finns även recensioner från bloggare: här och här. Ganska nyligen kom jag av misstag över en recension.

Grundläggande funktionalitet

WP UniParser-plugin som jag skapade kan göra följande:
hämta innehåll från webbplatser på alla motorer(parsern är konfigurerad med reguljära uttryck och begränsningssträngar, inställningen är väldigt enkel, jag kommer att förklara och visa allt, dessutom finns det en länk till den);
klipp ut skript, kommentarer, länkar, formulär, bilder, spann, objekt, såväl som alla fragment du anger från innehållet.
planpublicering inlägg;
placera det analyserade materialet i en kategori du definierar (eller fördela dem slumpmässigt i kategorier);
inse automatisk översättning(i valfri riktning) på alla språk som stöds av Google Translate.

Du kan lära dig mer om insticksprogrammets funktioner i skärmdumpen på dess adminpanel:

Det är också värt att till fullo förstå hur den universella griparen fungerar.

En parser för WordPress är en Datacol-inställning utformad för att samla in innehåll (nyheter, artiklar, recensioner, etc.) med ytterligare export till WordPress CMS.

I det här exemplet exporteras det resulterande innehållet till . Resultaten för varje inlägg sparas i en separat fil, vars namn genereras baserat på inläggets titel, och innehållet genereras baserat på den analyserade informationen. Du kan också ställa in direkt export till din WordPress-blogg. Hur man gör detta visas i videon.

Du kan testa parsern för WordPress gratis i demoversionen av programmet.
De främsta fördelarna med den Datacol-baserade parsern för WordPress är:

  • Möjligheten att anpassa parsing för WordPress specifikt för att passa dina behov (av dig eller).
  • Möjligheten att ytterligare bearbeta insamlad data med plugins och även ladda in dem i .
  • Möjlighet till cyklisk lansering av kampanjer. När resultatet av den första analysuppgiften kommer att vara indata till den andra datainsamlingsuppgiften. Läs mer.

Hur används parsern för WordPress?

Om du har skapat en blogg, så blir det efter en tid klart för dig att det hela tiden behövs nytt unikt innehåll för att marknadsföra den. Och du blir för lat för att själv skriva artiklar och fylla i sidan manuellt. Men var kan jag få tag i det? nytt innehåll? Förr eller senare kommer tiden när du vill ta till autoblogging. Enkelt uttryckt, använd en parser som publicerar den information vi behöver på egen hand. En innehållstolk för WordPress hjälper oss att klara denna uppgift.

Alla hemsidor har någon gång skapats från grunden. Men om syftet med din sajt är att tillhandahålla information blir det intressant först när informationsmängden överstiger en viss mängd. WordPress bloggparser är en utmärkt lösning för en sådan uppgift. Med dess hjälp kan du en kort tid komma ikapp konkurrenterna genom att avsevärt utöka webbplatsens informationskatalog. WordPress-parsern kan implementeras som en grabber för WordPress från en specifik webbplats.

Parser för WordPress blogg kan hjälpa till att lösa många problem, här är några av dem:
— Inledande fyllning av resursen (en webbplatsanalys för WordPress gör att du kan fylla din blogg med information från början till den önskade volymen på kortast möjliga tid);
— skapande av en automatiskt ifylld blogg (WordPress-parsern kommer att kunna säkerställa regelbunden automatisk uppdatering av webbplatsens innehåll)
— publicera innehåll "på ett schema" (du kan schemalägga tiden för att lägga till inlägg på din webbplats)

Massinlägg i WordPress

Parsern för WordPress som presenteras i Datacol är ett tydligt exempel använda en parser för masspublicering. Det låter dig automatiskt ta emot innehåll och publicera det på din blogg. WordPress-skrapningsprocessen kan delas in i flera steg:

1) Processen att samla in innehåll. WordPress-parsern samlar in nödvändig information för varje blogginlägg: titel, innehåll (nedladdat med bilder som sparas på din dator för vidare nedladdning via FTP till din server), kategori, författare och länk från vilken data samlades in (URL).

2) Spara information som samlats in av parsern för WordPress. Efter analysen sparas den insamlade informationen TXT-filer(varje inlägg sparas i en separat textfil), vars namn genereras i enlighet med rubriken på inlägget.

3) Exportera WordPress. Det är också möjligt att direkt exportera tolkad information till din WordPress-blogg. Detta gör fyllningsprocessen mycket snabb och eliminerar risken för mänskliga fel. Möjligheten att exportera till WordPress ingår i programmets grundläggande funktionalitet. Du måste ange parametrarna för att ansluta till din blogg i programinställningarna och ange data som ska exporteras (titel, innehåll, kategori, etc.)

4) Informationsbehandling. Om så önskas kan informationen som samlas in under WordPress-parsningsprocessen bearbetas (till exempel utsättas för automatisk översättning eller synonymisering). Dessa funktioner implementeras med hjälp av plugins.

Hur analyserar man en WordPress-webbplats?

Du kan inte bara publicera tolkad information i WordPress, utan du kan också skrapa den från den. Uppgiften att använda andras WordPress-bloggar som innehållskälla för dina bloggar dyker upp ganska ofta. För att lösa det här problemet kommer en WordPress-webbplatsparser att hjälpa dig. Algoritmen för att arbeta med en WordPress-webbplatsparser liknar den som beskrivs ovan.

Fördelar med WordPress Website Parser

Du är förmodligen redan övertygad om att WordPress-bloggtolkaren kommer att hjälpa dig att inte spendera mycket tid och ansträngning på att manuellt fylla din blogg. Tack vare det kan du inte bara automatisera ditt arbete, utan också öka dess effektivitet. Du kan ladda ner parsern för WordPress, implementerad inom Datacol, på

Testar bloggparsern

Så här testar du bloggparsern:

Steg 2. Kampanjträdet innehåller kampanjen content-parsers/kolchaka-net.par. Välj den och klicka på knappen Spela. Innan du börjar kan du redigera indata. På så sätt kan du ställa in en länk till bloggen eller bloggsidorna från vilken du ska analysera innehåll.

Steg 3. Vänta tills resultatet av bloggtolken visas. Efter att resultaten har dykt upp kan du med våld sluta tolka (genom att klicka på knappen Stopp).

klicka på bilden för att förstora

Steg 4. Efter att ha avslutat/tvingat stopp av parsern i mappen Mina dokument kan du hitta textfiler(varje inlägg sparas i en separat fil), vars namn genereras baserat på inläggets titlar:

klicka på bilden för att förstora

Publikationer om ämnet