Plugin d'analyse. Analyseur de contenu gratuit - AftParser

Il existe de nombreux domaines d'activité dans lesquels un analyseur peut être utilisé, mais il s'agit principalement de la collecte de diverses informations. Vous pouvez collecter rapidement des images et des liens uniquement par programmation. L'utilisation d'un analyseur pour rechercher des informations vous permet d'automatiser ce processus, ce qui vous fait gagner beaucoup de temps. Si vous avez un site Web sur Wordpress, vous pouvez facilement le remplir automatiquement à l'aide de l'analyseur AftParser.

est un analyseur gratuit et universel pour WordPress. vous permet de collecter du contenu provenant d'une ou de différentes sources, en le traitant dans le format souhaité en PHP. L'analyseur est conçu comme un plugin pour WordPress. Après avoir installé le plugin normalement, un menu d'analyseur apparaîtra dans la console WordPress, comme sur l'image.

L'analyseur implémente deux outils principaux : l'analyseur de site WordPress et l'analyseur rss Wordpress.

L'analyseur pour WordPress peut :

1.Analyse les données des liens

Il vous suffit de fournir des liens vers la source. S'il n'y a pas de liens, ils peuvent être collectés par un analyseur. Spécifiez le chemin d'accès au plan du site et le grabber collectera tous les liens. Ou vous pouvez collecter des liens à partir de n’importe quelle page HTML. Les liens peuvent être filtrés selon les critères souhaités. Il existe deux filtres de liens avec lesquels vous pouvez modifier les conditions d'analyse. Les utilisateurs expérimentés peuvent créer eux-mêmes des macros d'analyse, ce qui rend l'analyseur très flexible pour répondre à leurs besoins.

2.Analyse les données du flux RSS

Tout est simple ici, entrez l'URL du flux souhaité et cliquez sur démarrer l'analyse.
L'une des utilisations possibles de l'analyseur WordPress consiste à remplir les colonnes d'actualités de votre site Web à l'aide de sources d'informations telles que des blogs, flux RSS s, pages VKontakte, etc. Concurrents - WP-O-Matic, FeedWordPress, CyberSyn.

Parfois, cela ne sert à rien de passer du temps à rédiger soi-même du texte pour un site WordPress. Ce cas ne s’applique pas aux blogs et sites d’information, puisque leurs revenus sont générés précisément grâce aux posts postés.

Et nous parlons de boutiques en ligne, de sites Web d'entreprises et de portails d'actualités qui ne sont pas conçus pour le trafic organique. Pour de telles ressources, des matériaux uniques ne sont pas aussi importants que leur mise à jour constante.

Pour créer un site de saisie automatique, vous devrez configurer un analyseur d'actualités pour votre projet. Vous devez d’abord trouver des sites appropriés à partir desquels vous gratterez. Ils doivent correspondre au sujet de votre projet, sinon cela ne sert à rien d'en dupliquer les informations. Si tel est le cas, vous devez alors passer à la deuxième partie de la solution au problème d'analyse - c'est ainsi que vous clonerez le texte d'un autre site. La méthode la plus primitive et la plus peu pratique est la copie manuelle. Mais il est bien plus sage d’utiliser l’un des plugins proposés dans cet article pour activer un analyseur d’actualités et de contenu performant.

WP-O-Matic

Un module très populaire pour WordPress qui vous permettra de mettre en place un analyseur fonctionnel d'actualités provenant d'autres sites. L'outil est installé par d'une manière simple: soit par téléchargement directement dans un dossier sur l'hébergement, soit via l'onglet « Plugins ».

Ensuite, vous devez configurer le plugin si vous souhaitez assurer l'analyse du contenu. Pour ce faire, il suffit de cliquer quatre fois sur « Suivant » et à la fin sur « Soumettre ». Ainsi, vous confirmez votre accord avec les conditions d'utilisation de ce module WordPress. En particulier, vous acceptez que vous êtes seul responsable du vol du matériel d'autrui, du contenu d'autres sites, etc.

Si, en plus du composant texte, vous êtes également intéressé par les images, vous devez alors créer un répertoire appelé Cache dans le dossier contenant le plugin. Définissez des droits d'accès spéciaux à ce dossier. Ensuite, vous devrez retourner dans la zone d’administration de WordPress. Accédez aux paramètres du plugin et regardez attentivement s'il y a une coche à côté de l'élément cron Unix. Vous devez cocher positivement la case Cache Image afin que l'analyseur d'actualités copie également les images sur votre ressource.

Le module WP-O-Matic est bon car il fonctionne sur n'importe quelle page du site. Vous pouvez ajouter une catégorie distincte si vous souhaitez que la liste des actualités et du contenu fournis par l'analyseur y soit affichée. Pour ce faire, créez d'abord la catégorie nécessaire. Ensuite, dans l'administrateur WordPress, dans les paramètres de l'outil WP-O-Matic, cliquez sur Ajouter une campagne. Dans la ligne Catégories, vérifiez la catégorie spéciale que vous avez créée. Et dans le formulaire Flux, saisissez le flux RSS que vous allez analyser. Vous pouvez saisir plusieurs URL de flux à la fois, afin que l'analyseur de texte collecte des informations sur trois, voire quatre ressources à la fois.

Et un autre énorme avantage du plugin WP-O-Matic est la publication automatique du matériel. Vous n’avez pas besoin de vous connecter à votre administrateur WordPress toutes les heures pour changer le statut de vos publications en « Publié ». Le module le fera tout seul. Et si vous le souhaitez, il peut unifier le texte grâce à un mécanisme de synonymisation spécial. C'est la principale différence entre cet outil et son concurrent – ​​le plugin FeedWordPress.

Datacol

Il s'agit d'un grabber fonctionnel qui ne convient pas seulement au moteur WordPress. Il ne s'agit pas seulement d'un analyseur de texte pour les pages de sites Web : c'est application intelligente, qui vous permet de filtrer le matériel copié. Par exemple, vous pourrez publier uniquement des articles contenant certains mots clés. Vous pouvez dupliquer les actualités directement depuis Yandex. Les matériaux clonés seront exportés dans l'un des 15 formats disponibles. Le service collectera non seulement du texte, mais également des titres, des photographies, la date de publication, des liens et d'autres données importantes.

Mais Datacol est distribué sur une base payante. Cependant, cela coûte beaucoup moins cher que si vous commandiez du matériel sur le site via des échanges. L'application coûte moins de 500 roubles et peut être utilisée pour presque tous les moteurs. Il existe une version démo.

Pince de saisie FDE

Un autre analyseur payant avec un grand nombre les fonctions. C'est déjà dans la catégorie des grabbers coûteux, puisqu'il coûtera environ 90 $. Mais il sera possible de l'utiliser sur 10 serveurs à la fois, c'est-à-dire qu'en théorie, différents webmasters pourront verser 9 $, ce qui rendra l'achat moins cher.

FDE Grabber n'est pas exactement un plugin WordPress. Les développeurs appellent leur création un système autonome qui fonctionne quel que soit le type de CMS installé sur le site. Les principales caractéristiques de ce système d'analyse :

  • télécharger des informations à grande échelle ou des fragments individuels ;
  • vous pouvez programmer des publications ;
  • si vous souhaitez unifier le matériel en double, il existe une fonction de synonymisation intégrée ;
  • vous pouvez travailler via des serveurs proxy ;
  • l'analyse est capable de contourner les redirections, ce qui peut poser problème pour d'autres plugins ;
  • vous pouvez télécharger automatiquement tout le contenu du site et le déplacer vers votre site (s'il s'agit de portails autres que d'actualité) ;

Vous pouvez configurer l'analyse entièrement à votre propre discrétion, car le programme a la capacité d'implémenter des microprogrammes pour corriger le travail. Par exemple, vous pouvez ainsi configurer les caractéristiques d'alignement et de conception du matériau copié. Vous pouvez également ajouter des paramètres noindex et nofollow pour tous les liens qui figureront dans le texte de la page. L'analyseur vous permet même de copier et de traduire automatiquement des articles provenant de ressources étrangères. Ce très bon moyen créez un flux constant de contenu sur vos pages qui commencera à attirer des visiteurs au fil du temps !

Un analyseur universel assez puissant pour WordPress. Permet de collecter du contenu provenant d'une ou plusieurs sources et de le traiter, en l'adaptant au format requis en utilisant toutes les capacités du langage PHP. Il existe une possibilité d'analyse retardée. Le meilleur analyseur WordPress gratuit du moment - AftParser est toujours à votre service !

Brève description de la fonctionnalité :

L'analyseur se compose de 4 pages : page d'accueil, page d'analyseur de liens, page d'analyseur de flux RSS et page de paramètres. Voici à quoi cela ressemblera après l'installation :

Attention: Vous pouvez lire comment configurer AftParser.

Commençons avec page d'accueil. Il affiche une liste des analyseurs en cours d'exécution.

Les explications sont fournies en blocs sur chaque page. Toute la documentation est prête à l'emploi ; il suffit de la lire attentivement pour que tout soit clair.

Analyseur de site Web :

La page de l'analyseur de site vous permet d'analyser les données provenant d'une ou de plusieurs sources. Il vous suffit de fournir des liens vers des documents.

Quoi? Trop paresseux pour parcourir le Web et collecter des documents à la main ? Ne désespérez pas, tout est automatisé.

Il existe deux outils qui vous permettent de remplir automatiquement votre liste de liens.

- une sorte d'émulation moteur de recherche. Le robot parcourra lui-même les pages du site qui lui sont transférées et en collectera tous les liens internes.

Naturellement, une liste de liens remplie d'algorithmes automatiques sera fortement encombrée de données inutiles. Et ici, les filtres vous viennent en aide.

- le plus simple et façon rapide filtration. Vous saisissez les conditions et le filtre effectue lui-même le traitement.

Filtre de liens avancé- un filtre de liens qui vous permet de modifier leur contenu et de faire plein d'autres choses différentes. Seulement pour utilisateurs expérimentés. Je vous conseille d'apprendre le php avant d'y faire quoi que ce soit.

Si vous avez terminé la collecte de liens, l'étape suivante consiste à ajouter des limites de contenu.

À l’aide de ces limites, l’analyseur déterminera les zones à traiter.

La coloration syntaxique est implémentée à l'aide de l'éditeur javascript ACE. Toute la documentation et toutes les fonctions disponibles sont fournies sur la page du plugin. La liste est très impressionnante et je ne peux pas la présenter ici, car ce matériel est déjà très long. Installez simplement le plugin et lisez, vous serez impressionné, je vous le garantis.

Voici à quoi ressemble la page Analyseur de flux RSS, à la seule différence qu’il n’y a aucune obligation de fournir des listes de liens.

Je vous présente l'universel Capture WordPress WP UniParser. Ce plugin est analyseur universel personnalisable. Lors de la création de publications, le plugin peut traduire le contenu via Service Google Traduisez en utilisant n’importe quelle paire de langues.

Avis des clients

Le sujet sur le serveur, où il y avait environ 6 à 7 avis, a été supprimé par les modérateurs (ils disent que le produit ne répond pas aux règles du forum). Néanmoins, une critique peut être lue sur le forum Mulnet et Armada. Il y a aussi des avis de blogueurs : ici et ici. Tout récemment, je suis tombé par hasard sur une critique.

Fonctionnalité de base

Le plugin WP UniParser que j'ai créé peut effectuer les opérations suivantes :
extraire le contenu de sites sur tous les moteurs(l'analyseur est configuré à l'aide d'expressions régulières et de chaînes de contraintes, la configuration est très simple, je vais tout expliquer et montrer, en plus, il y a un lien vers celui-ci) ;
coupez des scripts, des commentaires, des liens, des formulaires, des images, des étendues, des objets, ainsi que tout fragment que vous spécifiez à partir du contenu.
publication du plan des postes;
placez les matériaux analysés dans une catégorie que vous définissez (ou distribuez-les au hasard en catégories) ;
réaliser traduction automatique(dans n'importe quelle direction) dans toutes les langues prises en charge par Google Translate.

Vous pouvez en savoir plus sur l'ensemble des fonctions du plugin dans la capture d'écran de son panneau d'administration :

Il est également intéressant de bien comprendre le fonctionnement de la pince universelle.

Un analyseur pour WordPress est un paramètre Datacol conçu pour collecter du contenu (actualités, articles, critiques, etc.) avec une exportation ultérieure vers le CMS WordPress.

Dans cet exemple, le contenu résultant est exporté vers . Les résultats de chaque publication sont enregistrés dans un fichier séparé, dont le nom est généré en fonction du titre de la publication, et le contenu est généré en fonction des informations analysées. Vous pouvez également configurer l’exportation directe vers votre blog WordPress. Comment procéder est montré dans la vidéo.

Vous pouvez tester gratuitement l'analyseur pour WordPress dans la version démo du programme.
Les principaux avantages de l'analyseur basé sur Datacol pour WordPress sont :

  • La possibilité de personnaliser l'analyse pour WordPress spécifiquement en fonction de vos besoins (par vous ou).
  • La possibilité de traiter davantage les données collectées à l'aide de plugins et également de les charger dans .
  • Possibilité de lancement cyclique de campagnes. Lorsque les résultats de la première tâche d’analyse seront l’entrée de la deuxième tâche de collecte de données. En savoir plus.

Comment l’analyseur est-il utilisé pour WordPress ?

Si vous avez créé un blog, après un certain temps, il devient clair qu'un nouveau contenu unique est constamment nécessaire pour le promouvoir. Et vous devenez trop paresseux pour rédiger vous-même des articles et remplir le site manuellement. Mais où puis-je l'obtenir ? Nouveau contenu? Tôt ou tard, vient le moment où vous souhaitez recourir à l'autoblogging. En termes simples, utilisez un analyseur qui publiera lui-même les informations dont nous avons besoin. Un analyseur de contenu pour WordPress nous aidera à faire face à cette tâche.

Tous les sites Web ont à un moment donné été créés à partir de zéro. Mais si le but de votre site est de fournir des informations, il ne deviendra intéressant que lorsque la quantité d’informations dépassera un certain montant. L’analyseur de blog WordPress est une excellente solution pour une telle tâche. Avec son aide, vous pouvez un bref délais rattraper les concurrents en élargissant considérablement le catalogue d’informations du site. L'analyseur WordPress peut être implémenté comme un grabber pour WordPress à partir d'un site spécifique.

Analyseur pour Blog WordPress peut aider à résoudre de nombreux problèmes, en voici quelques-uns :
— remplissage initial de la ressource (un analyseur de site pour WordPress vous permettra de remplir votre blog d'informations à partir de zéro jusqu'au volume requis dans les plus brefs délais) ;
— création d'un blog auto-rempli (l'analyseur WordPress pourra assurer une mise à jour automatique régulière du contenu du site)
— publier du contenu « selon un calendrier » (vous pouvez programmer l'heure d'ajout de publications sur votre site)

Publication en masse dans WordPress

L'analyseur pour WordPress présenté dans Datacol est un exemple clair en utilisant un analyseur pour la publication en masse. Il vous permet de recevoir automatiquement du contenu et de le publier sur votre blog. Le processus de scraping WordPress peut être divisé en plusieurs étapes :

1) Le processus de collecte de contenu. L'analyseur WordPress collecte les informations nécessaires pour chaque article de blog : titre, contenu (téléchargé avec des images enregistrées sur votre ordinateur pour un téléchargement ultérieur via FTP sur votre serveur), catégorie, auteur et lien à partir duquel les données ont été collectées (URL).

2) Sauvegarde des informations collectées par l'analyseur pour WordPress. Après analyse, les informations collectées sont enregistrées Fichiers TXT(chaque message est enregistré dans un fichier texte séparé), dont les noms sont générés en fonction du titre du message.

3) Exportez WordPress. Il est également possible d’exporter directement les informations analysées vers votre blog WordPress. Cela rend le processus de remplissage très rapide et élimine la possibilité d’erreurs humaines. La possibilité d'exporter vers WordPress est incluse dans les fonctionnalités de base du programme. Vous devez préciser les paramètres de connexion à votre blog dans les paramètres du programme et préciser les données à exporter (titre, contenu, catégorie, etc.)

4) Traitement des informations. Si vous le souhaitez, les informations collectées lors du processus d'analyse WordPress peuvent être traitées (par exemple, soumises à une traduction automatique ou à une synonymisation). Ces fonctionnalités sont implémentées à l'aide de plugins.

Comment analyser un site WordPress ?

Vous pouvez non seulement publier des informations analysées dans WordPress, mais vous pouvez également les extraire. La tâche consistant à utiliser les blogs WordPress d’autres personnes comme source de contenu pour vos blogs se pose assez souvent. Pour résoudre ce problème, un analyseur de site WordPress vous aidera. L'algorithme pour travailler avec un analyseur de site WordPress est similaire à celui décrit ci-dessus.

Avantages de l'analyseur de sites Web WordPress

Vous êtes probablement déjà convaincu que l’analyseur de blog WordPress vous aidera à ne pas consacrer beaucoup de temps et d’efforts à remplir manuellement votre blog. Grâce à lui, vous pouvez non seulement automatiser votre travail, mais également augmenter son efficacité. Vous pouvez télécharger l'analyseur pour WordPress, implémenté dans Datacol, à l'adresse

Tester l'analyseur de blog

Pour tester l'analyseur de blog :

Étape 2. L'arborescence de la campagne contient la campagne content-parsers/kolchaka-net.par. Sélectionnez-le et cliquez sur le bouton Lecture. Avant de commencer, vous pouvez modifier les données d'entrée. De cette façon, vous pouvez définir un lien vers le blog ou les pages du blog à partir duquel vous analyserez le contenu.

Étape 3. Attendez que les résultats de l'analyseur de blog apparaissent. Une fois les résultats affichés, vous pouvez arrêter de force l'analyse (en cliquant sur le bouton Arrêter).

Cliquer sur l'image pour l'élargir

Étape 4. Après avoir terminé/arrêt forcé l'analyseur dans le dossier Mes documents, vous pouvez trouver fichiers texte(chaque article est enregistré dans un fichier séparé), dont les noms sont générés en fonction des titres des articles :

Cliquer sur l'image pour l'élargir

Publications sur le sujet