Complemento de análisis. Analizador de contenidos gratuito - AftParser

Hay bastantes áreas de actividad en las que se puede utilizar un analizador, pero principalmente es la recopilación de información diversa. Puede recopilar rápidamente imágenes y enlaces solo mediante programación. El uso de un analizador para buscar información le permite automatizar este proceso, lo que ahorra mucho tiempo. Si tiene un sitio web en Wordpress, puede completarlo automáticamente fácilmente utilizando el analizador AftParser.

es un analizador universal y gratuito para WordPress. le permite recopilar contenido de una o diferentes fuentes, procesándolo en el formato deseado en PHP. El analizador está creado como un complemento para WordPress. Después de instalar el complemento normalmente, aparecerá un menú del analizador en la consola de WordPress, como en la imagen.

El analizador implementa dos herramientas principales: el analizador de sitios de WordPress y el analizador de rss de Wordpress.

El analizador para WordPress puede:

1.Analiza datos de enlaces

Sólo necesita proporcionar enlaces a la fuente. Si no hay enlaces, un analizador puede recopilarlos. Especifique la ruta al mapa del sitio y el capturador recopilará todos los enlaces. O puede recopilar enlaces desde cualquier página HTML. Los enlaces se pueden filtrar según los criterios deseados. Hay dos filtros de enlace con los que puede cambiar las condiciones de análisis. Los usuarios experimentados pueden crear ellos mismos macros de análisis, lo que hace que el analizador sea muy flexible para adaptarse a sus necesidades.

2.Analiza los datos de la fuente RSS

Aquí todo es simple: ingrese la URL del feed deseada y haga clic en comenzar a analizar.
Uno de los posibles usos del analizador de wordpress es llenar columnas de noticias en su sitio web utilizando fuentes de información como blogs, RSS Feeds s, páginas de VKontakte, etc. Competidores: WP-O-Matic, FeedWordPress, CyberSyn.

A veces no tiene sentido dedicar tiempo a escribir texto para un sitio de WordPress. Este caso no aplica a blogs y sitios de información, ya que sus ingresos se generan precisamente gracias a las publicaciones publicadas.

Y hablamos de tiendas online, webs de empresas y portales de noticias que no están pensados ​​para tráfico orgánico. Para tales recursos, los materiales únicos no son tan importantes como su constante actualización.

Para crear un sitio de autocompletar, deberá configurar un analizador de noticias para su proyecto. Primero necesita encontrar sitios adecuados desde los cuales raspar. Deben corresponder al tema de su proyecto; de lo contrario, no tiene sentido duplicar información de ellos. Si este es el caso, entonces debe pasar a la segunda parte de la solución al problema de análisis: así es como clonará el texto de otro sitio. El método más primitivo e inconveniente es la copia manual. Pero es mucho más prudente utilizar uno de los complementos que se proporcionan en este artículo para activar un analizador de noticias y contenido exitoso.

WP-O-Matic

Un módulo muy popular para WordPress que le permitirá configurar un analizador de noticias funcional de otros sitios. La herramienta es instalada por de una manera sencilla: ya sea subiéndolo directamente a una carpeta del hosting, o a través de la pestaña “Complementos”.

A continuación, debe configurar el complemento si desea garantizar el análisis del contenido. Para hacer esto, simplemente haga clic en “Siguiente” cuatro veces y al final en “Enviar”. Por lo tanto, confirma su acuerdo con los términos de uso de este módulo de WordPress. En particular, usted acepta que usted es el único responsable del robo de materiales de otras personas, contenido de otros sitios, etc.

Si, además del componente de texto, también le interesan las imágenes, debe crear un directorio llamado Caché en la carpeta con el complemento. Establezca derechos de acceso especiales a esta carpeta. A continuación, deberá regresar al área de administración de WordPress. Vaya a la configuración del complemento y observe atentamente si hay una marca de verificación junto al elemento cron de Unix. Debe marcar afirmativamente la casilla Imagen en caché para que el analizador de noticias también copie imágenes en su recurso.

El módulo WP-O-Matic es bueno porque funciona en cualquier página del sitio. Puede agregar una categoría separada si desea que se muestre allí la lista de noticias y contenido proporcionado por el analizador. Para hacer esto, primero cree la categoría necesaria. Luego, en el administrador de WordPress, en la configuración de la herramienta WP-O-Matic, haga clic en Agregar campaña. En la línea Categorías, marque la categoría especial que creó. Y en el formulario Feeds, ingresa el feed RSS que vas a analizar. Puede ingresar varias URL para feeds a la vez, de modo que el analizador de texto recopile información de tres o incluso cuatro recursos a la vez.

Y otra gran ventaja del complemento WP-O-Matic es la publicación automática de material. No es necesario que inicie sesión en su administrador de WordPress cada hora para cambiar el estado de sus publicaciones a "Publicado". El módulo hará esto por sí solo. Y si lo desea, puede unificar el texto mediante un mecanismo especial de sinonimización. Ésta es la diferencia clave entre esta herramienta y su competidor: el complemento FeedWordPress.

datoscol

Este es un capturador funcional que es adecuado no solo para el motor de WordPress. Esto no es sólo un analizador de texto para páginas web: es aplicación inteligente, que le permite filtrar el material copiado. Por ejemplo, sólo podrá publicar artículos que contengan ciertos palabras clave. Puede duplicar noticias directamente desde Yandex. Los materiales clonados se exportarán en uno de los 15 formatos disponibles. El servicio recopilará no sólo texto, sino también titulares, fotografías, fecha de publicación, enlaces y otros datos importantes.

Pero Datacol se distribuye de forma paga. Sin embargo, es mucho más económico que si solicitara material en el sitio mediante intercambios. La aplicación cuesta menos de 500 rublos y se puede utilizar para casi cualquier motor. Hay una versión de demostración.

Agarrador FDE

Otro analizador pago con un número grande funciones. Esto ya está en la categoría de los captadores caros, ya que costará alrededor de 90 dólares. Pero será posible utilizarlo en 10 servidores a la vez, es decir, en teoría, diferentes webmasters pueden aportar 9 dólares, abaratando así la compra.

FDE Grabber no es exactamente un complemento de WordPress. Los desarrolladores llaman a su creación un sistema autónomo que funciona independientemente del tipo de CMS instalado en el sitio. Las principales características de este sistema de análisis:

  • descargar noticias completas o fragmentos individuales;
  • puedes programar publicaciones;
  • si desea unificar el material duplicado, existe una función de sinonimización incorporada;
  • puedes trabajar a través de servidores proxy;
  • el análisis puede evitar las redirecciones, lo que puede ser un problema para otros complementos;
  • puede descargar automáticamente todo el contenido del sitio y moverlo a su sitio (si se trata de portales que no son de noticias);

Puede configurar el análisis completamente a su discreción, ya que el programa tiene la capacidad de implementar microprogramas para corregir el trabajo. Por ejemplo, de esta manera puede configurar la alineación y las características de diseño del material copiado. También puede agregar parámetros noindex y nofollow para todos los enlaces que estarán en el texto de la página. El analizador incluso le permite copiar y traducir automáticamente artículos de recursos extranjeros. Este gran manera¡Cree un flujo constante de contenido en sus páginas que comenzará a atraer visitantes con el tiempo!

Un analizador universal bastante potente para WordPress. Le permite recopilar contenido de una o más fuentes y procesarlo, adaptándolo al formato requerido utilizando todas las capacidades del lenguaje PHP. Existe la posibilidad de que se retrase el análisis. El mejor analizador gratuito para WordPress del momento: ¡AftParser está siempre a su servicio!

Breve descripción de la funcionalidad:

El analizador consta de 4 páginas: página de inicio, página del analizador de enlaces, página del analizador de fuentes RSS y página de configuración. Así es como se verá después de la instalación:

Atención: Puede leer cómo configurar AftParser.

Empecemos con pagina de inicio. Muestra una lista de analizadores que se están ejecutando actualmente.

Las explicaciones se proporcionan en bloques en cada página. Toda la documentación viene fuera de la caja, basta con leerla atentamente para que quede todo claro.

Analizador de sitios web:

La página del analizador del sitio le permite analizar datos de una o varias fuentes. Solo necesita proporcionar enlaces a materiales.

¿Qué? ¿Demasiado vago para recorrer la web y recopilar materiales a mano? No desesperes: todo está automatizado.

Hay dos herramientas que le permiten completar su lista de enlaces automáticamente.

- una especie de emulación buscador. El propio robot recorrerá las páginas del sitio que se le hayan transferido y recopilará todos los enlaces internos de las mismas.

Naturalmente, una lista de enlaces llena de algoritmos automáticos estará repleta de datos innecesarios. Y aquí los filtros vienen en tu ayuda.

- el más simple y de manera rápida filtración. Usted ingresa las condiciones y el filtro realiza el procesamiento por sí mismo.

Filtro de enlace avanzado- un filtro de enlaces que te permite cambiar su contenido y hacer muchas otras cosas diferentes. Solo para usuarios experimentados. Te aconsejo que aprendas php antes de hacer algo allí.

Si ha completado la recopilación de enlaces, el siguiente paso es agregar límites de contenido.

Utilizando estos límites, el analizador determinará las áreas que deben procesarse.

El resaltado de sintaxis se implementa utilizando el editor de JavaScript ACE. Toda la documentación y todas las funciones disponibles se proporcionan en la página del complemento. La lista es muy impresionante y no puedo presentarla aquí porque este material ya es muy largo. Simplemente instale el complemento y lea, quedará impresionado, lo garantizo.

Así es como se ve la página. Analizador de feeds RSS, con la única diferencia de que no es necesario proporcionar listas de enlaces.

les presento el universal Capturador de WordPress WP UniParser. Este complemento es analizador universal personalizable. Al crear publicaciones, el complemento puede traducir el contenido a través de servicio de google Traduce usando cualquier combinación de idiomas.

Opiniones de los usuarios

Los moderadores eliminaron el tema en el servidor, donde había entre 6 y 7 reseñas (dicen que el producto no cumple con las reglas del foro). Sin embargo, se puede leer una reseña en el foro Mulnet y Armada. También hay reseñas de blogueros: aquí y aquí. Recientemente me encontré accidentalmente con una reseña.

Funcionalidad básica

El complemento WP UniParser que creé puede hacer lo siguiente:
extraer contenido de sitios en cualquier motor(el analizador se configura usando expresiones regulares y cadenas de restricción, la configuración es muy simple, explicaré y mostraré todo, además, hay un enlace al mismo);
corte guiones, comentarios, enlaces, formularios, imágenes, intervalos, objetos, así como cualquier fragmento que especifique del contenido.
publicación del plan puestos;
coloque los materiales analizados en una categoría que usted defina (o distribúyalos aleatoriamente en categorías);
darse cuenta traducción automática(en cualquier dirección) en cualquier idioma admitido por Google Translate.

Puedes conocer más sobre el conjunto de funciones del plugin en la captura de pantalla de su panel de administración:

También vale la pena comprender completamente el funcionamiento del capturador universal.

Un analizador para WordPress es una configuración de Datacol diseñada para recopilar contenido (noticias, artículos, reseñas, etc.) y exportarlo al CMS de WordPress.

En este ejemplo, el contenido resultante se exporta a . Los resultados de cada publicación se guardan en un archivo separado, cuyo nombre se genera en función del título de la publicación y el contenido se genera en función de la información analizada. También puedes configurar la exportación directa a tu blog de WordPress. Cómo hacer esto se muestra en el video.

Puedes probar el analizador de WordPress de forma gratuita en la versión de demostración del programa.
Las principales ventajas del analizador basado en Datacol para WordPress son:

  • La capacidad de personalizar el análisis de WordPress específicamente para satisfacer sus necesidades (por usted o).
  • La capacidad de procesar aún más los datos recopilados mediante complementos y también cargarlos en .
  • Posibilidad de lanzamiento cíclico de campañas. Cuando los resultados de la primera tarea de análisis serán la entrada para la segunda tarea de recopilación de datos. Leer más.

¿Cómo se utiliza el analizador para WordPress?

Si ha creado un blog, después de un tiempo tendrá claro que constantemente se necesita contenido nuevo y único para promocionarlo. Y te vuelves demasiado vago para escribir artículos tú mismo y completar el sitio manualmente. ¿Pero dónde puedo conseguirlo? nuevo contenido? Tarde o temprano llega el momento en que quieres recurrir al autoblogging. En pocas palabras, utilice un analizador que publicará la información que necesitamos por sí solo. Un analizador de contenidos para WordPress nos ayudará a afrontar esta tarea.

Todos los sitios web en algún momento han sido creados desde cero. Pero si el propósito de su sitio es proporcionar información, sólo será interesante cuando la cantidad de información supere cierta cantidad. El analizador de blogs de WordPress es una excelente solución para tal tarea. Con su ayuda puedes un tiempo corto ponerse al día con los competidores ampliando significativamente el catálogo de información del sitio. El analizador de WordPress se puede implementar como un capturador de WordPress desde un sitio específico.

Analizador para Blog de WordPress puede ayudar a resolver muchos problemas, estos son algunos de ellos:
— llenado inicial del recurso (un analizador de sitios para WordPress le permitirá llenar su blog con información desde cero hasta el volumen requerido en el menor tiempo posible);
— creación de un blog autocompletado (el analizador de WordPress podrá garantizar la actualización automática periódica del contenido del sitio)
— publicar contenido “según un cronograma” (puede programar el tiempo para agregar publicaciones a su sitio)

Publicación masiva en WordPress

El analizador para WordPress presentado en Datacol es un ejemplo claro usando un analizador para publicaciones masivas. Te permite recibir contenido automáticamente y publicarlo en tu blog. El proceso de scraping de WordPress se puede dividir en varias etapas:

1) El proceso de recopilación de contenidos. El analizador de WordPress recopila la información necesaria para cada publicación de blog: título, contenido (descargado con imágenes que se guardan en su computadora para descargarlas posteriormente a través de FTP a su servidor), categoría, autor y enlace desde donde se recopilaron los datos (URL).

2) Guardar la información recopilada por el analizador para WordPress. Después del análisis, la información recopilada se guarda. Archivos TXT(cada publicación se guarda en un archivo de texto separado), cuyos nombres se generan de acuerdo con el título de la publicación.

3) Exportar WordPress. También es posible exportar directamente información analizada a su blog de WordPress. Esto hace que el proceso de llenado sea muy rápido y elimina la posibilidad de errores humanos. La capacidad de exportar a WordPress está incluida en la funcionalidad básica del programa. Debe especificar los parámetros para conectarse a su blog en la configuración del programa y especificar los datos que se exportarán (título, contenido, categoría, etc.)

4) Procesamiento de información. Si lo desea, la información recopilada durante el proceso de análisis de WordPress se puede procesar (por ejemplo, someterla a traducción automática o sinonimización). Estas funciones se implementan mediante complementos.

¿Cómo analizar un sitio de WordPress?

No sólo puedes publicar información analizada en WordPress, sino que también puedes extraerla de él. La tarea de utilizar los blogs de WordPress de otras personas como fuente de contenido para sus blogs surge con bastante frecuencia. Para resolver este problema, un analizador de sitios de WordPress le ayudará. El algoritmo para trabajar con un analizador de sitios de WordPress es similar al descrito anteriormente.

Beneficios del analizador de sitios web de WordPress

Probablemente ya esté convencido de que el analizador de blogs de WordPress le ayudará a no perder mucho tiempo y esfuerzo rellenando manualmente su blog. Gracias a él, no sólo podrás automatizar tu trabajo, sino también aumentar su eficiencia. Puede descargar el analizador para WordPress, implementado dentro de Datacol, en

Probando el analizador de blogs

Para probar el analizador de blogs:

Paso 2. El árbol de campaña contiene la campaña content-parsers/kolchaka-net.par. Selecciónelo y haga clic en el botón Reproducir. Antes de comenzar, puede editar los datos de entrada. De esta manera, puede establecer un enlace al blog o a las páginas del blog desde las que analizará el contenido.

Paso 3. Espere a que aparezcan los resultados del analizador del blog. Después de que aparezcan los resultados, puede detener el análisis a la fuerza (haciendo clic en el botón Detener).

haga clic en la imagen para ampliar

Paso 4. Después de finalizar/forzar la detención del analizador en la carpeta Mis documentos, puede encontrar archivos de texto(cada publicación se guarda en un archivo separado), cuyos nombres se generan en función de los títulos de las publicaciones:

haga clic en la imagen para ampliar

Publicaciones sobre el tema.