সুচিপত্র:

ইমেজ প্রসেসিং এর একটি ভূমিকা: পিক্সি এবং এর বিকল্প: Ste টি ধাপ
ইমেজ প্রসেসিং এর একটি ভূমিকা: পিক্সি এবং এর বিকল্প: Ste টি ধাপ

ভিডিও: ইমেজ প্রসেসিং এর একটি ভূমিকা: পিক্সি এবং এর বিকল্প: Ste টি ধাপ

ভিডিও: ইমেজ প্রসেসিং এর একটি ভূমিকা: পিক্সি এবং এর বিকল্প: Ste টি ধাপ
ভিডিও: 💥 ম্যাজিক একটি ব্যবহার অনেকে জানেনা 👉 How to Convert Any Picture Text in MS Word 2024, জুন
Anonim
ইমেজ প্রসেসিংয়ের একটি ভূমিকা: পিক্সি এবং এর বিকল্প
ইমেজ প্রসেসিংয়ের একটি ভূমিকা: পিক্সি এবং এর বিকল্প

এই নিবন্ধে, আমরা ডিজিটাল ইমেজ প্রসেসিং (ডিআইপি) এর অর্থ এবং ছবি বা ভিডিওতে একটি প্রক্রিয়া করার জন্য পিক্সি এবং অন্যান্য সরঞ্জামগুলির মতো হার্ডওয়্যার ব্যবহারের কারণ ব্যাখ্যা করব। এই নিবন্ধের শেষে, আপনি শিখবেন:

  • কিভাবে একটি ডিজিটাল ইমেজ ফর্ম।
  • ডিজিটাল ইমেজ প্রসেসিং কি।
  • ইমেজ প্রক্রিয়াকরণের জন্য সরঞ্জাম।
  • পিক্সি কী এবং এটি কীভাবে ব্যবহার করবেন।

ধাপ 1: ইমেজ প্রসেসিং কি?

ইমেজ প্রসেসিং কি?
ইমেজ প্রসেসিং কি?

ফটো, ভিডিও এবং সাধারণত ছবিগুলি আমাদের স্মৃতির একটি মুহূর্ত সংরক্ষণের পাশাপাশি অন্যান্য অ্যাপ্লিকেশনও রয়েছে। হয়তো আপনি পাবলিক প্লেসে সিকিউরিটি ক্যামেরা দেখতে পান অথবা আপনি রোবটগুলিকে একটি লাইন, অবজেক্ট ট্র্যাক করতে দেখেছেন অথবা পরিস্থিতি উপলব্ধি করতে আরো উন্নত, প্রোডাকশন লাইনের পণ্য থেকে অমেধ্য আলাদা করে এবং অনেকগুলি অনুরূপ বা এমনকি অনুরূপ অ্যাপ্লিকেশনগুলি ছবিগুলির কিছু হিসাবের সাথে করছে এবং এইগুলি গণনার নাম ইমেজ প্রসেসিং।

সর্বোত্তম বোঝার জন্য, ছবির কাঠামো জানা সহায়ক। প্রতিটি ইমেজ পিক্সেল মান সঙ্গে যে কোন সময়ে একটি সংকেত। (পিক্সেল হল একটি ডিজিটাল চিত্রের মৌলিক একক যার উজ্জ্বলতা এবং/অথবা রঙের জন্য বিভিন্ন মান থাকতে পারে, এই মানগুলিকে "তীব্রতা" বলা হয়) সংকেত হল ভিজ্যুয়াল সেন্সর দ্বারা প্রদত্ত অবিচ্ছিন্ন ভোল্টেজ সংকেত, এই সংকেত ডিজিটাল রূপান্তরিত হবে স্যাম্পলিং এর মত কিছু প্রক্রিয়া সহ ফর্ম। এই ডেটার ডিজিটাল ফর্ম হল একটি দ্বিমাত্রিক অ্যারে বা ম্যাট্রিক্স একটি ডিজিটাল ইমেজ তৈরি করে যাতে তাদের ফর্ম অবস্থান এবং মানের জন্য f (X, Y) হয়। ভুলে যাবেন না যে প্রতিটি ভিডিও একটি সেকেন্ডে খেলার নির্দিষ্ট হারের সাথে চিত্রগুলির একটি সেট।

একটি ছবি তৈরির পরে, প্রক্রিয়াটি শুরু হবে। কোন উদ্দেশ্যে আমাদের একটি প্রক্রিয়া প্রয়োজন? যদি আমাদের একটি ছবি থেকে তথ্য প্রয়োজন হয়, আমরা কম্পিউটার ভিশন ব্যবহার করতে যাচ্ছি। কম্পিউটার দৃষ্টি মানুষের দৃষ্টি অনুকরণ করার একটি উপায়। মানুষের দৃষ্টিশক্তি "শিখতে" এবং চাক্ষুষ ইনপুট থেকে তথ্য দেওয়ার ক্ষমতা রাখে। কম্পিউটার ভিশন মূলত সেই ক্ষেত্র যা কম্পিউটারকে ডিজিটাল ছবি বা ভিডিও থেকে উচ্চ-স্তরের বোঝার জন্য তৈরি করেছে, এমনকি রিয়েল-টাইম ব্যবহারের জন্যও; এবং ডিজিটাল ইমেজ প্রসেসিং এর একটি অংশ।

ধাপ 2: ইমেজ প্রসেসিং কিভাবে করবেন?

ইমেজ প্রসেসিং কিভাবে করবেন?
ইমেজ প্রসেসিং কিভাবে করবেন?
ইমেজ প্রসেসিং কিভাবে করবেন?
ইমেজ প্রসেসিং কিভাবে করবেন?

যদি আমরা ছবি প্রক্রিয়াকরণের জন্য একটি রোবোটিক অ্যাপ্লিকেশন সম্পর্কে চিন্তা করি, তাহলে দুটি উপায় আছে:

  1. একটি সাধারণ ক্যামেরা মডিউল নির্বাচন করা (এটিতে কোন প্রক্রিয়াকরণ ছাড়াই ছবি সরবরাহ করা) এবং তারপরে ব্যবহারকারী দ্বারা প্রোগ্রামিং এবং গণনা ব্যবহার করা।
  2. দ্রুত এবং সহজ ব্যবহারের জন্য এই প্রক্রিয়াটি করে এমন কঠিন পণ্য ব্যবহার করা; পিক্সি ক্যামেরার মত …

প্রথম সমাধান: প্রথম পদ্ধতির জন্য, কোডিংয়ের জন্য MATLAB বা OpenCV এর মত বিভিন্ন নরম পণ্য রয়েছে। প্রক্রিয়াকরণ সরঞ্জামগুলিতে অন্যান্য নামও রয়েছে; কিন্তু এই প্রক্রিয়াকরণের জন্য অনুসন্ধান করা জনপ্রিয় নাম হল OpenCV এবং MATLAB। আসুন তাদের মধ্যে একটি দ্রুত তুলনা দেখি। MATLAB এবং OpenCV তুলনার চার্ট আমাদের সাহায্য করবে।

দ্বিতীয় সমাধান: একটি বিশেষ হার্ডওয়্যার ব্যবহার করে! ইমেজ প্রসেসিং এর ক্ষমতা সম্পন্ন ক্যামেরার মত। তাদের সাধারণত একটি ইউজার ইন্টারফেস থাকে এবং কোডিংয়ের প্রয়োজন হয় না। এটি সহজ বলে মনে হয় কিন্তু একরকম সীমাবদ্ধতা তৈরি করে এবং তারা সেটার জন্য যা নির্দিষ্ট করে তা করতে পারে; উদাহরণস্বরূপ, একটি মুখ সনাক্তকরণ ক্যামেরা সাধারণত রঙের স্বীকৃতি দিতে পারে না (হয়তো ফার্মওয়্যারের কিছু পরিবর্তন স্বীকৃতি অ্যালগরিদম পরিবর্তন করতে পারে কিন্তু এটি একটি কঠিন এবং সাধারণ উপায় নয়!) দুটি উপায়, কিন্তু কোনটি ভাল?

দ্বিতীয় চার্ট দুটি উপায়ে তুলনা করা হয়।

ধাপ 3: পিক্সি দ্বারা শুরু করা

পিক্সি দ্বারা শুরু করা
পিক্সি দ্বারা শুরু করা

ছবি প্রক্রিয়াকরণের জন্য নির্দিষ্ট ক্যামেরা মডিউলগুলির মধ্যে একটি হল PIXY, স্বীকৃতি অ্যালগরিদম হল রঙ ভিত্তিক ফিল্টারিং। এই ক্যামেরার মূল উদ্দেশ্য হল স্বীকৃতি রং এবং তাদের পরিচিত বস্তু হিসেবে নামকরণ করা। এই ক্যামেরাটি "শিখতে" পারে যে আপনি প্রথমে কোন রঙগুলি "ভেবেছিলেন"।

এখন যেহেতু আপনি জানেন যে পিক্সি কি, আসুন দেখি কিভাবে আমরা পিক্সি ব্যবহার শুরু করতে পারি।

ধাপ 4: প্রয়োজনীয় হার্ডওয়্যার

প্রয়োজনীয় হার্ডওয়্যার
প্রয়োজনীয় হার্ডওয়্যার

Pixy CMUcam5 ইমেজ সেন্সর

Arduino UNO R3

ধাপ 5: পিক্সি দ্বারা শুরু করা

পিক্সি দ্বারা শুরু করা
পিক্সি দ্বারা শুরু করা

এখন, শেষ পর্যন্ত ধাপে ধাপে আমাদের সাথে আসুন:

প্রথম ধাপ:

একটি পিক্সি কেনা! নিয়মিত PIXY এবং PIXY2 পিক্সি ক্যামেরার দুটি সংস্করণ। রেগুলার টাইপ কেনার জন্য উপরের লিঙ্কে ক্লিক করুন, যা আমরা এই বোর্ড ব্যবহার করার ধাপগুলো অব্যাহত রাখি।

দ্বিতীয়:

এটিকে চালু কর. বোর্ডে পাওয়ারের জন্য একটি ইউএসবি পোর্ট রয়েছে। এটি কম্পিউটারের ইউএসবি পোর্টের সাথে সংযুক্ত হয়ে চালিত হবে।এটি ব্যাটারি (6-10v) সহ বোর্ডের পিছনে দুটি পিনের মাধ্যমে চালিত হতে পারে।

তৃতীয়:

ইউএসবি ক্যাবলের মাধ্যমে এটি কম্পিউটারে সংযুক্ত করুন। একটি প্রান্ত কম্পিউটারে এবং অন্যটি পিক্সির মাইক্রো ইউএসবি পোর্টে।

চতুর্থ:

আপনার ক্যামের সফটওয়্যারটি এখানে ডাউনলোড করুন। PIXY সোম লিনাক্স, ম্যাক এবং উইন্ডোজ প্ল্যাটফর্মের জন্য PIXY এর অ্যাপ্লিকেশন। এই অ্যাপটি কি করতে পারে কনফিগারেশন এবং PIXY কি দেখতে পারে তা দেখান।

পঞ্চম:

এই বিন্দু পর্যন্ত, ক্যামেরাটি মাইক্রোকন্ট্রোলার বা বোর্ডের সাথে অগত্যা সংযুক্ত হওয়ার প্রয়োজন নেই যদি আপনার অন্য কিছু ছাড়া দেখতে এবং চিনতে হয়; স্বীকৃতি মাইক্রো সংযোগের উপর নির্ভর করে না। যাইহোক, শেখানোর জন্য, স্বতন্ত্র এবং ভাল বর্ণ সহ একটি বস্তু নির্বাচন করুন। হিউ-ভিত্তিক রঙ ফিল্টারিং স্বীকৃতি অ্যালগরিদমের কারণে, পরিবেশের রঙ এবং আলো ফলাফলকে প্রভাবিত করতে পারে। সুতরাং, সাদা, কালো বা ধূসর বস্তুগুলি বেছে নেবেন না কারণ এই রঙগুলি রঙিন নয়!

ষষ্ঠ:

শেখানো শুরু করতে PIXY এর উপরে বোতাম টিপুন। প্রথমে, LED জ্বলবে এবং তার পরে, একটি RGB LED দৃষ্টিশক্তি এলাকার কেন্দ্রীয় অংশের রঙ পাবে। ক্যামেরার সামনে বস্তুটি বাছুন, যদি LED সঠিক রঙ দেখায় তবে এটি সঠিক লকিং দেখায়। লেন্স এবং বস্তুর মধ্যে দূরত্ব 6-20 ইঞ্চি হওয়া উচিত। দ্বিতীয় উপায় হল PIXY MON ব্যবহার করা; PIXY MON- এ বস্তুর একটি বড় এলাকা বেছে নেয় এবং তারপর এটি বস্তুটি নির্বাচন করে।

সপ্তম:

বস্তুর গ্রিড পিক্সি সোম দেখানো হবে। দেখুন গ্রিড বস্তুর সঠিক ক্ষেত্র যদি পটভূমি সহ নয়। কনফিগারেশনে স্লাইডারগুলি একটি ভাল এলাকা পেতে সাহায্য করতে পারে।

অষ্টম:

এখন প্রতিটি "রঙ" এর জন্য, ক্যামেরা একটি সংখ্যা সেট করবে। 7 টি স্বাক্ষর মানে 7 টি রং চিনতে হবে। একে অপরের কাছাকাছি রং ব্যবহার করে, উদাহরণস্বরূপ, লাল-গোলাপী-নীল রঙের একটি লেবেল আপনি ক্যামেরার জন্য একটি বস্তু বা স্থান নির্ধারণ করতে পারেন, উদাহরণস্বরূপ, সেই লেবেলটি দরজার স্থান দেখায়। এই ক্যামেরা দিয়ে হাজার হাজার বস্তু চিনতে সাহায্য করতে পারে! এই রঙের সেটকে "কালার কোড" বা CC বলা হয়। সিসি সেট করার জন্য আপনার PIXY সোম ব্যবহার করা উচিত এবং তারপর এটি কোন স্বাক্ষরের মত ব্যবহার করা যেতে পারে।

নবম:

একটি সফল শিক্ষার পরে, যদি একটি মাইক্রোকন্ট্রোলার বা বোর্ড ক্যামেরার সাথে সংযুক্ত থাকে, তাহলে পিক্সি দ্বারা চিহ্নিত বস্তুটি দিতে পারে। আপনি যদি আরডুইনো ব্যবহার করেন, সংযোগের জন্য এই পিনআউটটি ব্যবহার করুন। (আরো তথ্যের জন্য এখানে ক্লিক করুন), তারপর এখানে PIXY লাইব্রেরি ডাউনলোড করুন, স্কেচ> লাইব্রেরি অন্তর্ভুক্ত করুন> জিপ লাইব্রেরি যোগ করুন Arduino এর লাইব্রেরিতে যোগ করুন। এখন লাইব্রেরির জিপ ফাইল নির্বাচন করুন। ওটা করা শেষ! এখন PIXY এর ডিফল্ট স্কেচ দিয়ে, এটি বস্তুর X এবং Y (অবস্থান) এবং প্রস্থ এবং দৈর্ঘ্য (আকার) দেবে। অন্যান্য স্কেচগুলিও ব্যবহার করা যেতে পারে; প্যান এবং কাত মত। অন্যান্য বোর্ড সংযোগের জন্য, আপনি এখানে দেখতে পারেন।

দ্রষ্টব্য: শিক্ষার দুটি পদ্ধতি আছে যেমন আমরা ব্যাখ্যা করেছি: 1. PIXY MON ছাড়া PIXY ব্যবহার করা, যেমন রোবট কি করে এবং তারা একটি PC- এর সাথে সংযুক্ত নয়। পদ্ধতি হবে কিন্তু কিভাবে স্বাক্ষর নম্বর সেট করবেন? নেতৃত্ব যদি PIXY শিক্ষার প্রথম মুহুর্তে রঙ পরিবর্তন করে, আপনি যে ক্লিকটি করবেন তাতে কোন নম্বরটি সেট করবে; লাল অর্থ 1 থেকে ভায়োলেট অর্থ 7। পদ্ধতি 2 এ, সংখ্যা সেটিং শুধুমাত্র প্রয়োগের মাধ্যমে করা হবে।

ধাপ 6: "শেষ" এর খুব কাছে

ছবিগুলি ব্যবহারের প্রয়োজনীয়তা কী, ডিজিটাল ইমেজ প্রসেসিং কী এবং এটি কীভাবে করা যায় সে সম্পর্কে আমরা ব্যাখ্যা করেছি। আমাদের কোন উপায় আছে এবং হার্ডওয়্যার থেকে যেগুলি বর্তমানে আমাদের সাহায্য করতে পারে, আমরা ব্যাখ্যা করার জন্য PIXY বেছে নিয়েছি। আমরা ব্যাখ্যা করেছি যে এটি কীভাবে কাজ করে এবং আপনি যদি পিক্সি ক্যামেরার একজন শিক্ষানবিশ হন তাহলে কী করবেন! এখন আপনি আপনার ছোট রোবটের জন্য ইমেজ প্রসেসিং শুরু করতে পারেন এবং আপনার কম্পিউটারের সাথে তৃতীয় চোখ থাকা উপভোগ করতে পারেন।

আপনি এই প্রকল্পটি ইলেক্ট্রোপিকের অফিসিয়াল ওয়েবসাইটেও পড়তে পারেন:

প্রস্তাবিত: