পার্সিং প্লাগইন। ফ্রি কন্টেন্ট পার্সার - AftParser

কার্যকলাপের বেশ কয়েকটি ক্ষেত্র রয়েছে যেখানে একটি পার্সার ব্যবহার করা যেতে পারে, তবে প্রধানত এটি বিভিন্ন তথ্য সংগ্রহ। আপনি দ্রুত ছবি এবং লিঙ্ক সংগ্রহ করতে পারেন শুধুমাত্র প্রোগ্রামগতভাবে. তথ্য অনুসন্ধানের জন্য একটি পার্সার ব্যবহার করে আপনি এই প্রক্রিয়াটিকে স্বয়ংক্রিয় করতে পারবেন, উল্লেখযোগ্যভাবে সময় বাঁচাতে পারবেন। আপনার যদি Wordpress-এ একটি ওয়েবসাইট থাকে, তাহলে আপনি সহজেই AftParser পার্সার ব্যবহার করে এটি স্বয়ংক্রিয়ভাবে পূরণ করতে পারেন।

ওয়ার্ডপ্রেসের জন্য একটি বিনামূল্যে, সর্বজনীন পার্সার। আপনাকে এক বা ভিন্ন উৎস থেকে বিষয়বস্তু সংগ্রহ করতে দেয়, এটি পিএইচপি-তে পছন্দসই বিন্যাসে প্রক্রিয়াকরণ করে। পার্সারটি ওয়ার্ডপ্রেসের জন্য একটি প্লাগইন হিসাবে তৈরি করা হয়েছে। প্লাগইনটি সাধারনভাবে ইন্সটল করার পর, ছবির মতো ওয়ার্ডপ্রেস কনসোলে একটি পার্সার মেনু প্রদর্শিত হবে।

পার্সার দুটি প্রধান টুল প্রয়োগ করে: ওয়ার্ডপ্রেস সাইট পার্সার এবং ওয়ার্ডপ্রেস আরএসএস পার্সার।

ওয়ার্ডপ্রেসের জন্য পার্সার করতে পারেন:

1. লিঙ্ক থেকে ডেটা পার্স করে

আপনি শুধু উৎস লিঙ্ক প্রদান করতে হবে. যদি কোন লিঙ্ক না থাকে, সেগুলি একটি পার্সার দ্বারা সংগ্রহ করা যেতে পারে। সাইটের মানচিত্রের পথ নির্দিষ্ট করুন এবং গ্র্যাবার সমস্ত লিঙ্ক সংগ্রহ করবে। অথবা যেকোনো html পেজ থেকে লিঙ্ক সংগ্রহ করতে পারেন। লিঙ্ক পছন্দসই মানদণ্ড অনুযায়ী ফিল্টার করা যেতে পারে. দুটি লিঙ্ক ফিল্টার রয়েছে যার সাহায্যে আপনি পার্সিং শর্ত পরিবর্তন করতে পারেন। অভিজ্ঞ ব্যবহারকারীরা নিজেরাই পার্সিং ম্যাক্রো তৈরি করতে পারে, যা পার্সারকে তাদের প্রয়োজন অনুসারে খুব নমনীয় করে তোলে।

2. RSS ফিড ডেটা পার্স করে

এখানে সবকিছুই সহজ, পছন্দসই ফিড URL লিখুন এবং পার্সিং শুরু করুন ক্লিক করুন।
ওয়ার্ডপ্রেস পার্সারের সম্ভাব্য ব্যবহারগুলির মধ্যে একটি হল ব্লগের মতো তথ্য উত্স ব্যবহার করে আপনার ওয়েবসাইটে সংবাদ কলামগুলি পূরণ করা। আরএসএস ফিড s, VKontakte পেজ, ইত্যাদি। প্রতিযোগীরা - WP-O-Matic, FeedWordPress, CyberSyn।

কখনও কখনও একটি ওয়ার্ডপ্রেস সাইটের জন্য টেক্সট লিখতে সময় ব্যয় করার কোন মানে নেই. এই কেসটি ব্লগ এবং তথ্য সাইটগুলিতে প্রযোজ্য নয়, যেহেতু তাদের আয় পোস্ট করা পোস্টগুলির জন্য অবিকল ধন্যবাদ উত্পন্ন হয়৷

এবং আমরা অনলাইন স্টোর, কোম্পানির ওয়েবসাইট এবং নিউজ পোর্টাল সম্পর্কে কথা বলছি যেগুলি জৈব ট্র্যাফিকের জন্য ডিজাইন করা হয়নি। এই ধরনের সংস্থানগুলির জন্য, অনন্য উপকরণগুলি তাদের ক্রমাগত আপডেট করার মতো গুরুত্বপূর্ণ নয়।

একটি অটোফিল সাইট তৈরি করতে, আপনাকে আপনার প্রকল্পের জন্য একটি নিউজ পার্সার সেট আপ করতে হবে৷ প্রথমে আপনাকে উপযুক্ত সাইটগুলি খুঁজে বের করতে হবে যেখান থেকে আপনি স্ক্র্যাপ করবেন। তাদের অবশ্যই আপনার প্রকল্পের বিষয়ের সাথে সামঞ্জস্যপূর্ণ হতে হবে, অন্যথায় তাদের কাছ থেকে তথ্য নকল করার কোন মানে নেই। যদি এটি হয়, তাহলে আপনাকে পার্সিং সমস্যার সমাধানের দ্বিতীয় অংশে এগিয়ে যেতে হবে - এইভাবে আপনি অন্য সাইট থেকে পাঠ্য ক্লোন করবেন। সবচেয়ে আদিম এবং অসুবিধাজনক পদ্ধতি হ'ল ম্যানুয়াল অনুলিপি। তবে একটি সফল সংবাদ এবং বিষয়বস্তু পার্সার সক্রিয় করতে এই নিবন্ধে দেওয়া প্লাগইনগুলির একটি ব্যবহার করা অনেক বেশি বুদ্ধিমানের কাজ।

WP-O-Matic

ওয়ার্ডপ্রেসের জন্য একটি খুব জনপ্রিয় মডিউল যা আপনাকে অন্যান্য সাইট থেকে একটি কার্যকরী সংবাদ পার্সার সেট আপ করার অনুমতি দেবে। টুল দ্বারা ইনস্টল করা হয় একটি সহজ উপায়ে: হয় হোস্টিং-এর একটি ফোল্ডারে সরাসরি আপলোড করার মাধ্যমে, অথবা "প্লাগইনস" ট্যাবের মাধ্যমে।

পরবর্তী, আপনি যদি সামগ্রী পার্সিং নিশ্চিত করতে চান তবে আপনাকে প্লাগইনটি কনফিগার করতে হবে। এটি করতে, চারবার "পরবর্তী" ক্লিক করুন এবং শেষে "জমা দিন"। এইভাবে, আপনি এই ওয়ার্ডপ্রেস মডিউল ব্যবহারের শর্তাবলীর সাথে আপনার চুক্তি নিশ্চিত করেছেন। বিশেষ করে, আপনি সম্মত হন যে আপনি একা অন্য লোকেদের সামগ্রী, অন্যান্য সাইট থেকে সামগ্রী ইত্যাদি চুরির জন্য দায়ী৷

যদি, পাঠ্য উপাদান ছাড়াও, আপনি ছবিগুলিতেও আগ্রহী হন, তবে আপনাকে প্লাগইন সহ ফোল্ডারে ক্যাশে নামে একটি ডিরেক্টরি তৈরি করতে হবে। এই ফোল্ডারে বিশেষ অ্যাক্সেসের অধিকার সেট করুন। এরপরে, আপনাকে ওয়ার্ডপ্রেস অ্যাডমিন এলাকায় ফিরে যেতে হবে। প্লাগইন সেটিংসে যান এবং ইউনিক্স ক্রন আইটেমের পাশে একটি চেকমার্ক আছে কিনা তা সাবধানে দেখুন। আপনাকে ইতিবাচকভাবে ক্যাশে ইমেজ বক্সটি চেক করতে হবে যাতে নিউজ পার্সারও আপনার রিসোর্সে ছবি কপি করে।

WP-O-Matic মডিউলটি ভালো কারণ এটি সাইটের যেকোনো পৃষ্ঠায় কাজ করে। আপনি যদি পার্সারের দেওয়া সংবাদ এবং বিষয়বস্তুর তালিকা সেখানে প্রদর্শন করতে চান তবে আপনি একটি পৃথক বিভাগ যোগ করতে পারেন। এটি করার জন্য, প্রথমে প্রয়োজনীয় বিভাগ তৈরি করুন। তারপরে ওয়ার্ডপ্রেস অ্যাডমিনে WP-O-Matic টুল সেটিংসে, ক্যাম্পেইন যোগ করুন ক্লিক করুন। বিভাগ লাইনে, আপনার তৈরি করা বিশেষ বিভাগটি পরীক্ষা করুন। এবং ফিড ফর্মে, RSS ফিডটি লিখুন যা আপনি পার্স করতে যাচ্ছেন। আপনি একবারে ফিডের জন্য একাধিক URL লিখতে পারেন, যাতে পাঠ্য পার্সার একবারে তিন বা এমনকি চারটি সংস্থান থেকে তথ্য সংগ্রহ করে।

এবং WP-O-Matic প্লাগইনের দিক থেকে আরেকটি বিশাল প্লাস হল উপাদানের স্বয়ংক্রিয় প্রকাশনা। আপনার পোস্টগুলির স্থিতি "প্রকাশিত" এ পরিবর্তন করতে আপনাকে প্রতি ঘন্টায় আপনার ওয়ার্ডপ্রেস অ্যাডমিনে লগ ইন করতে হবে না। মডিউল নিজেই এটি করবে। এবং যদি আপনি চান, এটি একটি বিশেষ সমার্থক প্রক্রিয়ার মাধ্যমে পাঠ্যকে অনন্য করতে পারে। এটি এই টুল এবং এর প্রতিযোগীর মধ্যে মূল পার্থক্য - FeedWordPress প্লাগইন।

ডাটাকল

এটি একটি কার্যকরী গ্র্যাবার যা শুধুমাত্র ওয়ার্ডপ্রেস ইঞ্জিনের জন্য উপযুক্ত নয়। এটি শুধুমাত্র ওয়েবসাইট পৃষ্ঠাগুলির জন্য একটি পাঠ্য পার্সার নয় - এটি স্মার্ট অ্যাপ, যা আপনাকে কপি করা উপাদান ফিল্টার করতে দেয়। উদাহরণস্বরূপ, আপনি শুধুমাত্র নির্দিষ্ট নিবন্ধগুলি পোস্ট করতে সক্ষম হবেন কীওয়ার্ড. আপনি Yandex থেকে সরাসরি খবর নকল করতে পারেন। ক্লোন করা উপকরণ 15টি উপলব্ধ ফরম্যাটের একটিতে রপ্তানি করা হবে। পরিষেবাটি কেবল পাঠ্যই নয়, শিরোনাম, ফটোগ্রাফ, প্রকাশের তারিখ, লিঙ্ক এবং অন্যান্য গুরুত্বপূর্ণ ডেটা সংগ্রহ করবে।

কিন্তু ডেটাকল পেইড ভিত্তিতে বিতরণ করা হয়। যাইহোক, আপনি যদি এক্সচেঞ্জের মাধ্যমে সাইটে উপাদান অর্ডার করেন তার চেয়ে এটি অনেক সস্তা। অ্যাপ্লিকেশনটির খরচ 500 রুবেলেরও কম এবং প্রায় যেকোনো ইঞ্জিনের জন্য ব্যবহার করা যেতে পারে। একটি ডেমো সংস্করণ আছে.

এফডিই গ্র্যাবার

সঙ্গে অন্য অর্থ প্রদান পার্সার একটি বড় সংখ্যাফাংশন এটি ইতিমধ্যে ব্যয়বহুল গ্র্যাবারদের বিভাগে রয়েছে, কারণ এটির দাম হবে প্রায় $90৷ কিন্তু এটি একবারে 10টি সার্ভারে ব্যবহার করা সম্ভব হবে, অর্থাৎ, তত্ত্বগতভাবে, বিভিন্ন ওয়েবমাস্টার $9-এ চিপ করতে পারে, এইভাবে ক্রয়টি সস্তা হবে৷

FDE Grabber ঠিক একটি ওয়ার্ডপ্রেস প্লাগইন নয়। বিকাশকারীরা তাদের তৈরিকে একটি স্বায়ত্তশাসিত সিস্টেম বলে যা সাইটে ইনস্টল করা সিএমএসের প্রকার নির্বিশেষে কাজ করে। এই পার্সিং সিস্টেমের প্রধান বৈশিষ্ট্য:

  • সম্পূর্ণ-স্কেল সংবাদ বা পৃথক টুকরা ডাউনলোড করা;
  • আপনি প্রকাশনা নির্ধারণ করতে পারেন;
  • আপনি যদি ডুপ্লিকেট উপাদান অনন্য করতে চান, একটি অন্তর্নির্মিত সমার্থক ফাংশন আছে;
  • আপনি প্রক্সি সার্ভারের মাধ্যমে কাজ করতে পারেন;
  • পার্সিং পুনঃনির্দেশ বাইপাস করতে সক্ষম, যা অন্যান্য প্লাগইনগুলির জন্য একটি সমস্যা হতে পারে;
  • আপনি সাইট থেকে স্বয়ংক্রিয়ভাবে সমস্ত সামগ্রী ডাউনলোড করতে পারেন এবং এটিকে আপনার সাইটে স্থানান্তর করতে পারেন (যদি এটি অ-নিউজ পোর্টালগুলির সাথে সম্পর্কিত হয়);

আপনি আপনার নিজস্ব বিবেচনার ভিত্তিতে সম্পূর্ণরূপে পার্সিং সেট আপ করতে পারেন, যেহেতু প্রোগ্রামটির কাজটি সংশোধন করার জন্য মাইক্রোপ্রোগ্রামগুলি বাস্তবায়ন করার ক্ষমতা রয়েছে। উদাহরণস্বরূপ, এইভাবে আপনি অনুলিপি করা উপাদানের প্রান্তিককরণ এবং নকশা বৈশিষ্ট্যগুলি কনফিগার করতে পারেন। আপনি পৃষ্ঠার পাঠ্যে থাকা সমস্ত লিঙ্কের জন্য noindex এবং nofollow প্যারামিটার যোগ করতে পারেন। এমনকি পার্সার আপনাকে বিদেশী সংস্থানগুলি থেকে নিবন্ধগুলি অনুলিপি করতে এবং স্বয়ংক্রিয়ভাবে অনুবাদ করার অনুমতি দেয়। এই দুর্দান্ত উপায়আপনার পৃষ্ঠাগুলিতে একটি ধ্রুবক সামগ্রী তৈরি করুন যা সময়ের সাথে দর্শকদের আকর্ষণ করতে শুরু করবে!

ওয়ার্ডপ্রেসের জন্য বেশ শক্তিশালী সার্বজনীন পার্সার। আপনাকে পিএইচপি ভাষার সমস্ত ক্ষমতা ব্যবহার করে প্রয়োজনীয় বিন্যাসে অভিযোজিত করে এক বা একাধিক উত্স থেকে সামগ্রী সংগ্রহ করতে এবং এটি প্রক্রিয়া করার অনুমতি দেয়। পার্সিং বিলম্বিত একটি সম্ভাবনা আছে. এই মুহুর্তে ওয়ার্ডপ্রেসের জন্য সেরা ফ্রি পার্সার - AftParser সর্বদা আপনার সেবায় রয়েছে!

কার্যকারিতার সংক্ষিপ্ত বিবরণ:

পার্সার 4টি পৃষ্ঠা নিয়ে গঠিত: হোম পেজ, লিঙ্ক পার্সার পৃষ্ঠা, RSS ফিড পার্সার পৃষ্ঠা এবং সেটিংস পৃষ্ঠা৷ ইনস্টলেশনের পরে এটি দেখতে কেমন হবে তা এখানে:

মনোযোগ:আপনি কিভাবে AftParser কনফিগার করবেন তা পড়তে পারেন।

চলো আমরা শুরু করি হোম পেজ. এটি বর্তমানে চলমান পার্সারের একটি তালিকা প্রদর্শন করে।

ব্যাখ্যা প্রতিটি পৃষ্ঠায় ব্লক দেওয়া হয়. সমস্ত ডকুমেন্টেশন বাক্সের বাইরে আসে; সবকিছু পরিষ্কার করার জন্য এটি সাবধানে পড়ুন।

ওয়েবসাইট পার্সার:

সাইট পার্সার পৃষ্ঠা আপনাকে এক এবং একাধিক উৎস থেকে ডেটা পার্স করতে দেয়। আপনি শুধু উপকরণ লিঙ্ক প্রদান করতে হবে.

কি? ওয়েব ঘষতে এবং হাতে উপকরণ সংগ্রহ করতে খুব অলস? হতাশ হবেন না - সবকিছু স্বয়ংক্রিয়।

দুটি টুল রয়েছে যা আপনাকে আপনার লিঙ্কগুলির তালিকা স্বয়ংক্রিয়ভাবে পূরণ করতে দেয়।

- এক ধরনের অনুকরণ খোঁজ যন্ত্র. রোবট নিজেই এটিতে স্থানান্তরিত সাইটের পৃষ্ঠাগুলির মধ্য দিয়ে হাঁটবে এবং তাদের থেকে সমস্ত অভ্যন্তরীণ লিঙ্ক সংগ্রহ করবে।

স্বাভাবিকভাবেই, স্বয়ংক্রিয় অ্যালগরিদম দিয়ে পূর্ণ লিঙ্কগুলির একটি তালিকা অপ্রয়োজনীয় ডেটা দিয়ে ভারীভাবে আটকে থাকবে। এবং এখানে ফিল্টার আপনার সাহায্যে আসা.

- সবচেয়ে সহজ এবং দ্রুত উপায়পরিস্রাবণ আপনি শর্ত লিখুন এবং ফিল্টার নিজেই প্রক্রিয়াকরণ সঞ্চালন.

উন্নত লিঙ্ক ফিল্টার- একটি লিঙ্ক ফিল্টার যা আপনাকে তাদের বিষয়বস্তু পরিবর্তন করতে এবং অন্যান্য বিভিন্ন জিনিসগুলির একটি গুচ্ছ করতে দেয়৷ শুধুমাত্র জন্য অভিজ্ঞ ব্যবহারকারীরা. আমি আপনাকে সেখানে কিছু করার আগে php শিখতে পরামর্শ দিচ্ছি।

আপনি যদি লিঙ্ক সংগ্রহ সম্পূর্ণ করে থাকেন, তাহলে পরবর্তী ধাপ হল বিষয়বস্তুর সীমানা যোগ করা।

এই সীমানাগুলি ব্যবহার করে, পার্সার প্রক্রিয়া করা প্রয়োজন এমন ক্ষেত্রগুলি নির্ধারণ করবে।

সিনট্যাক্স হাইলাইটিং জাভাস্ক্রিপ্ট এডিটর ACE ব্যবহার করে প্রয়োগ করা হয়। সমস্ত ডকুমেন্টেশন এবং সমস্ত উপলব্ধ ফাংশন প্লাগইন পৃষ্ঠায় প্রদান করা হয়. তালিকাটি খুব চিত্তাকর্ষক এবং আমি এটি এখানে উপস্থাপন করতে পারি না, যেহেতু এই উপাদানটি ইতিমধ্যেই খুব দীর্ঘ। শুধু প্লাগইন ইন্সটল করুন এবং পড়ুন, আপনি মুগ্ধ হবেন, আমি গ্যারান্টি দিচ্ছি।

এই পেজ মত দেখায় কি RSS ফিড পার্সার, শুধুমাত্র পার্থক্য যে লিঙ্কের তালিকা প্রদান করার কোন প্রয়োজন নেই.

আমি আপনাকে সর্বজনীন উপস্থাপন ওয়ার্ডপ্রেস গ্র্যাবার WP UniParser. এই প্লাগইন হয় সর্বজনীন কাস্টমাইজযোগ্য পার্সার. পোস্ট তৈরি করার সময়, প্লাগইন এর মাধ্যমে বিষয়বস্তু অনুবাদ করতে পারে Google পরিষেবাযেকোনো ভাষার জোড়া ব্যবহার করে অনুবাদ করুন।

ক্রেতার পর্যালোচনা

সার্ভারের বিষয়, যেখানে প্রায় 6-7টি পর্যালোচনা ছিল, মডারেটরদের দ্বারা মুছে ফেলা হয়েছিল (তারা বলে যে পণ্যটি ফোরামের নিয়মগুলি পূরণ করে না)। তবুও, একটি পর্যালোচনা মুলনেট ফোরাম এবং আরমাডাতে পড়া যেতে পারে। এছাড়াও ব্লগারদের থেকে পর্যালোচনা আছে: এখানে এবং এখানে. বেশ সম্প্রতি আমি ঘটনাক্রমে একটি পর্যালোচনা জুড়ে এসেছি.

মৌলিক কার্যকারিতা

আমার তৈরি করা WP UniParser প্লাগইন নিম্নলিখিত কাজ করতে পারে:
থেকে বিষয়বস্তু টান যেকোনো ইঞ্জিনে সাইট(পার্সারটি নিয়মিত এক্সপ্রেশন এবং সীমাবদ্ধতার স্ট্রিং ব্যবহার করে কনফিগার করা হয়েছে, সেটআপটি খুব সহজ, আমি সবকিছু ব্যাখ্যা করব এবং দেখাব, উপরন্তু, এটির একটি লিঙ্ক রয়েছে);
স্ক্রিপ্ট, মন্তব্য, লিঙ্ক, ফর্ম, ছবি, স্প্যান, অবজেক্ট, সেইসাথে আপনার বিষয়বস্তু থেকে নির্দিষ্ট করা যেকোনো টুকরো কাটুন।
পরিকল্পনা প্রকাশনাপোস্ট;
পার্স করা উপকরণগুলিকে আপনার সংজ্ঞায়িত একটি বিভাগে রাখুন (বা এলোমেলোভাবে বিভাগগুলিতে বিতরণ করুন);
উপলব্ধি করা স্বয়ংক্রিয় অনুবাদ Google অনুবাদ দ্বারা সমর্থিত যেকোনো ভাষায় (যে কোনো দিকে)।

আপনি এর অ্যাডমিন প্যানেলের স্ক্রিনশটে প্লাগইনটির ফাংশন সেট সম্পর্কে আরও জানতে পারেন:

সার্বজনীন গ্র্যাবারের অপারেশনটি সম্পূর্ণরূপে বোঝাও সার্থক।

ওয়ার্ডপ্রেসের জন্য একটি পার্সার হল একটি ডেটাকল সেটিং যা ওয়ার্ডপ্রেস সিএমএসে আরও রপ্তানির সাথে সামগ্রী (সংবাদ, নিবন্ধ, পর্যালোচনা, ইত্যাদি) সংগ্রহ করার জন্য ডিজাইন করা হয়েছে।

এই উদাহরণে, ফলস্বরূপ সামগ্রী রপ্তানি করা হয়। প্রতিটি পোস্টের ফলাফল একটি পৃথক ফাইলে সংরক্ষিত হয়, যার নাম পোস্টের শিরোনামের উপর ভিত্তি করে তৈরি করা হয় এবং পার্স করা তথ্যের উপর ভিত্তি করে বিষয়বস্তু তৈরি করা হয়। আপনি আপনার ওয়ার্ডপ্রেস ব্লগে সরাসরি রপ্তানি সেট আপ করতে পারেন। এটি কীভাবে করবেন তা ভিডিওতে দেখানো হয়েছে।

আপনি প্রোগ্রামের ডেমো সংস্করণে বিনামূল্যে ওয়ার্ডপ্রেসের জন্য পার্সার পরীক্ষা করতে পারেন।
ওয়ার্ডপ্রেসের জন্য ডেটাকল-ভিত্তিক পার্সারের প্রধান সুবিধাগুলি হল:

  • ওয়ার্ডপ্রেসের জন্য পার্সিং কাস্টমাইজ করার ক্ষমতা বিশেষভাবে আপনার প্রয়োজন অনুসারে (আপনার দ্বারা বা)।
  • প্লাগইনগুলি ব্যবহার করে সংগৃহীত ডেটা আরও প্রক্রিয়া করার ক্ষমতা এবং এগুলি লোড করার ক্ষমতা৷
  • প্রচারণার চক্রাকার লঞ্চের সম্ভাবনা। যখন প্রথম পার্সিং টাস্কের ফলাফল দ্বিতীয় ডেটা সংগ্রহের টাস্কে ইনপুট হবে। আরও পড়ুন।

কিভাবে ওয়ার্ডপ্রেসের জন্য পার্সার ব্যবহার করা হয়?

আপনি যদি একটি ব্লগ তৈরি করে থাকেন, তবে কিছু সময় পরে এটি আপনার কাছে পরিষ্কার হয়ে যায় যে এটি প্রচার করার জন্য ক্রমাগত নতুন অনন্য সামগ্রী প্রয়োজন। এবং আপনি নিজেই নিবন্ধ লিখতে এবং ম্যানুয়ালি সাইটটি পূরণ করতে খুব অলস হয়ে যান। কিন্তু কোথায় পাব? নতুন উপাদান? শীঘ্রই বা পরে সময় আসে যখন আপনি অটোব্লগিং অবলম্বন করতে চান। সহজ কথায়, এমন একটি পার্সার ব্যবহার করুন যা আমাদের প্রয়োজনীয় তথ্য নিজে থেকেই প্রকাশ করবে। ওয়ার্ডপ্রেসের জন্য একটি বিষয়বস্তু পার্সার আমাদের এই কাজটি মোকাবেলা করতে সাহায্য করবে।

সব ওয়েবসাইটই কোনো না কোনো সময়ে স্ক্র্যাচ থেকে তৈরি করা হয়েছে। কিন্তু যদি আপনার সাইটের উদ্দেশ্য তথ্য প্রদান করা হয়, তবে এটি শুধুমাত্র তখনই আকর্ষণীয় হয়ে উঠবে যখন তথ্যের পরিমাণ একটি নির্দিষ্ট পরিমাণ অতিক্রম করে। ওয়ার্ডপ্রেস ব্লগ পার্সার এই ধরনের কাজের জন্য একটি চমৎকার সমাধান। এর সাহায্যে আপনি পারবেন একটি ছোট সময়সাইটের তথ্যের ক্যাটালগ উল্লেখযোগ্যভাবে প্রসারিত করে প্রতিযোগীদের সাথে যোগাযোগ করুন। ওয়ার্ডপ্রেস পার্সার একটি নির্দিষ্ট সাইট থেকে ওয়ার্ডপ্রেসের জন্য গ্র্যাবার হিসাবে প্রয়োগ করা যেতে পারে।

জন্য পার্সার ওয়ার্ডপ্রেস ব্লগঅনেক সমস্যা সমাধানে সাহায্য করতে পারে, তার মধ্যে কয়েকটি এখানে দেওয়া হল:
— রিসোর্সের প্রাথমিক ফিলিং (ওয়ার্ডপ্রেসের জন্য একটি সাইট পার্সার আপনাকে আপনার ব্লগকে স্ক্র্যাচ থেকে প্রয়োজনীয় ভলিউম পর্যন্ত তথ্য দিয়ে স্বল্পতম সময়ে পূরণ করতে দেবে);
— একটি স্বয়ংক্রিয়-পূর্ণ ব্লগ তৈরি করা (ওয়ার্ডপ্রেস পার্সার সাইটের বিষয়বস্তুর নিয়মিত স্বয়ংক্রিয় আপডেট নিশ্চিত করতে সক্ষম হবে)
— “একটি সময়সূচীতে” বিষয়বস্তু প্রকাশ করা (আপনি আপনার সাইটে পোস্ট যোগ করার জন্য সময় নির্ধারণ করতে পারেন)

ওয়ার্ডপ্রেসে বাল্ক পোস্টিং

Datacol এ উপস্থাপিত ওয়ার্ডপ্রেসের জন্য পার্সার হল একটি স্পষ্ট উদাহরণভর পোস্ট করার জন্য একটি পার্সার ব্যবহার করে। এটি আপনাকে স্বয়ংক্রিয়ভাবে সামগ্রী গ্রহণ করতে এবং আপনার ব্লগে প্রকাশ করতে দেয়৷ ওয়ার্ডপ্রেস স্ক্র্যাপিং প্রক্রিয়াটি কয়েকটি পর্যায়ে বিভক্ত করা যেতে পারে:

1) বিষয়বস্তু সংগ্রহের প্রক্রিয়া। ওয়ার্ডপ্রেস পার্সার প্রতিটি ব্লগ পোস্টের জন্য প্রয়োজনীয় তথ্য সংগ্রহ করে: শিরোনাম, বিষয়বস্তু (ছবিগুলির সাথে ডাউনলোড করা হয় যা আপনার সার্ভারে FTP এর মাধ্যমে আরও ডাউনলোড করার জন্য আপনার কম্পিউটারে সংরক্ষিত হয়), বিভাগ, লেখক এবং লিঙ্ক যেখান থেকে ডেটা সংগ্রহ করা হয়েছিল (URL)।

2) ওয়ার্ডপ্রেসের জন্য পার্সার দ্বারা সংগৃহীত তথ্য সংরক্ষণ করা। পার্স করার পরে, সংগৃহীত তথ্য সংরক্ষণ করা হয় TXT ফাইল(প্রতিটি পোস্ট একটি পৃথক পাঠ্য ফাইলে সংরক্ষিত হয়), যার নাম পোস্টের শিরোনাম অনুসারে তৈরি করা হয়।

3) ওয়ার্ডপ্রেস রপ্তানি করুন। আপনার ওয়ার্ডপ্রেস ব্লগে পার্স করা তথ্য সরাসরি রপ্তানি করাও সম্ভব। এটি ফিলিং প্রক্রিয়াটিকে খুব দ্রুত করে তোলে এবং মানুষের ত্রুটির সম্ভাবনা দূর করে। ওয়ার্ডপ্রেসে রপ্তানি করার ক্ষমতা প্রোগ্রামের মৌলিক কার্যকারিতার অন্তর্ভুক্ত। আপনাকে প্রোগ্রাম সেটিংসে আপনার ব্লগের সাথে সংযোগ করার পরামিতিগুলি নির্দিষ্ট করতে হবে এবং রপ্তানি করা ডেটা নির্দিষ্ট করতে হবে (শিরোনাম, বিষয়বস্তু, বিভাগ, ইত্যাদি)

4) তথ্য প্রক্রিয়াকরণ। যদি ইচ্ছা হয়, ওয়ার্ডপ্রেস পার্সিং প্রক্রিয়া চলাকালীন সংগৃহীত তথ্য প্রক্রিয়া করা যেতে পারে (উদাহরণস্বরূপ, স্বয়ংক্রিয় অনুবাদ বা সমার্থককরণের বিষয়)। এই বৈশিষ্ট্যগুলি প্লাগইন ব্যবহার করে প্রয়োগ করা হয়।

কিভাবে একটি ওয়ার্ডপ্রেস সাইট পার্স?

আপনি শুধুমাত্র ওয়ার্ডপ্রেসে পার্স করা তথ্য প্রকাশ করতে পারবেন না, তবে আপনি এটি থেকে স্ক্র্যাপও করতে পারেন। আপনার ব্লগের জন্য বিষয়বস্তুর উত্স হিসাবে অন্য লোকের ওয়ার্ডপ্রেস ব্লগগুলি ব্যবহার করার কাজটি প্রায়শই দেখা দেয়। এই সমস্যা সমাধানের জন্য, একটি ওয়ার্ডপ্রেস সাইট পার্সার আপনাকে সাহায্য করবে। একটি ওয়ার্ডপ্রেস সাইট পার্সারের সাথে কাজ করার জন্য অ্যালগরিদম উপরে বর্ণিত অনুরূপ।

ওয়ার্ডপ্রেস ওয়েবসাইট পার্সারের সুবিধা

আপনি সম্ভবত ইতিমধ্যেই নিশ্চিত যে ওয়ার্ডপ্রেস ব্লগ পার্সার আপনাকে সাহায্য করবে আপনার ব্লগটি ম্যানুয়ালি পূরণ করতে অনেক সময় এবং প্রচেষ্টা ব্যয় না করতে। এটির জন্য ধন্যবাদ, আপনি কেবল আপনার কাজকে স্বয়ংক্রিয় করতে পারবেন না, তবে এর দক্ষতাও বাড়াতে পারবেন। আপনি ওয়ার্ডপ্রেসের জন্য পার্সার ডাউনলোড করতে পারেন, এটি ডাটাকলের মধ্যে প্রয়োগ করা হয়েছে, এ

ব্লগ পার্সার পরীক্ষা করা হচ্ছে

ব্লগ পার্সার পরীক্ষা করতে:

ধাপ 2. ক্যাম্পেইন ট্রিতে content-parsers/kolchaka-net.par প্রচারাভিযান রয়েছে। এটি নির্বাচন করুন এবং প্লে বোতামে ক্লিক করুন। শুরু করার আগে, আপনি ইনপুট ডেটা সম্পাদনা করতে পারেন৷ এইভাবে আপনি ব্লগ বা ব্লগ পৃষ্ঠাগুলির একটি লিঙ্ক সেট করতে পারেন যেখান থেকে আপনি বিষয়বস্তু পার্স করবেন।

ধাপ 3. ব্লগ পার্সারের ফলাফল প্রদর্শিত হওয়ার জন্য অপেক্ষা করুন। ফলাফলগুলি উপস্থিত হওয়ার পরে, আপনি জোর করে পার্সিং বন্ধ করতে পারেন (স্টপ বোতামে ক্লিক করে)।

সম্প্রসারিত করা ছবিটি দেখার জন্য ক্লিক করুন

ধাপ 4. আমার ডকুমেন্টস ফোল্ডারে পার্সার শেষ/জোর করে বন্ধ করার পরে আপনি খুঁজে পেতে পারেন পাঠ্য ফাইল(প্রতিটি পোস্ট একটি পৃথক ফাইলে সংরক্ষিত হয়), যার নাম পোস্ট শিরোনামের উপর ভিত্তি করে তৈরি করা হয়:

সম্প্রসারিত করা ছবিটি দেখার জন্য ক্লিক করুন

বিষয়ে প্রকাশনা