সুচিপত্র:

একটি একক ছবি থেকে 3D পুনর্গঠন: 8 টি ধাপ
একটি একক ছবি থেকে 3D পুনর্গঠন: 8 টি ধাপ

ভিডিও: একটি একক ছবি থেকে 3D পুনর্গঠন: 8 টি ধাপ

ভিডিও: একটি একক ছবি থেকে 3D পুনর্গঠন: 8 টি ধাপ
ভিডিও: Add Curtains Transitions Effect in PowerPoint Slide in Bangla 2024, নভেম্বর
Anonim
একটি একক ছবি থেকে 3D পুনর্গঠন
একটি একক ছবি থেকে 3D পুনর্গঠন
একটি একক ছবি থেকে 3D পুনর্গঠন
একটি একক ছবি থেকে 3D পুনর্গঠন

3D পুনর্গঠনের কাজটি সাধারণত বাইনোকুলার ভিশনের সাথে যুক্ত থাকে। বিকল্পভাবে, আপনি বস্তুর চারপাশে একটি একক ক্যামেরা সরাতে পারেন। এদিকে, বস্তুর আকৃতি জানা থাকলে, কাজটি একক ছবি থেকে সমাধান করা যেতে পারে। যে আপনার শুধুমাত্র একটি ক্যামেরা আছে এবং এটি সরানো হয় না। আসুন ধাপে ধাপে এটি কীভাবে করা যায় তা দেখুন। আমরা রুবিক্স কিউব ব্যবহার করব কারণ এটি ভাল মানসম্পন্ন এবং বৈশিষ্ট্যগুলির একটি সমৃদ্ধ সেট রয়েছে। এটি একটি খুব সহজ বস্তু এবং একই সাথে একটি জটিল নির্মাণ হিসাবে বিবেচিত হতে পারে। কাজেই মেশিন ভিশনকে অবশ্যই যথেষ্ট বাধা অতিক্রম করতে হবে যাতে কাজটি সম্পন্ন করা যায়।

ধাপ 1: কাজের জটিলতা মূল্যায়ন করুন

কাজের জটিলতা মূল্যায়ন করুন
কাজের জটিলতা মূল্যায়ন করুন
কাজের জটিলতা মূল্যায়ন করুন
কাজের জটিলতা মূল্যায়ন করুন
টাস্কের জটিলতা মূল্যায়ন করুন
টাস্কের জটিলতা মূল্যায়ন করুন
টাস্কের জটিলতা মূল্যায়ন করুন
টাস্কের জটিলতা মূল্যায়ন করুন

প্রথম নজরে, কাজটি সহজ। কেন্দ্রীয় গিঁটটি খুঁজুন যেখানে ঘনক্ষেত্রের 3 প্রান্ত একত্রিত হয় এবং এই প্রান্তগুলি আঁকুন। তাদের স্থানাঙ্ক থেকে, ক্যামেরা এবং ঘূর্ণনের কোণ থেকে দূরত্ব গণনা করা সম্ভব। সমস্যা হল এই লাইনগুলি বিদ্যমান নেই। বাম ছবি থেকে আপনি দেখতে পাবেন যে প্রতিটি প্রান্ত 2 সমান্তরাল রেখা দ্বারা প্রতিনিধিত্ব করা হয়। উপরন্তু, উপরের ডান ছবি দেখায় যে তাদের প্রতিটি 3 টি বিভাগে বিভক্ত। তদুপরি, যদি আমরা জনপ্রিয় হাফ ট্রান্সফর্মের একটি রূপ প্রয়োগ করি যা লাইন বিভাগগুলি সনাক্ত করতে পারে তবে এটি কিছু ত্রুটি সহ কাজটি সম্পাদন করে যা কেন্দ্রীয় গিঁট সনাক্ত করা অসম্ভব করে তোলে। যদি প্রান্তগুলি একে অপরের কাছে না পৌঁছায়, তাহলে কোন একক বিন্দু নেই। যদি ডিটেকশন শেষের দিকে ওভারশুট করে, এটি প্রান্তের মাঝখানে গিঁটের মতো দেখবে যেমনটি আপনি বাকি 2 টি ছবিতে দেখছেন।

ধাপ 2: সঠিক পদ্ধতির সন্ধান করুন

সঠিক পদ্ধতির সন্ধান করুন
সঠিক পদ্ধতির সন্ধান করুন

যখন অনেকগুলি বিবরণ নির্ণায়ক অ্যালগরিদমগুলিকে অকার্যকর করে তোলে, তখন সম্ভাব্য পদ্ধতি বিবেচনা করার সময় এসেছে। যদি আমরা চিত্রের গড় প্যারামিটার গণনা করি, তাদের ত্রুটিগুলি উল্লেখযোগ্যভাবে হ্রাস পাবে এবং বিপরীতভাবে পদ্ধতিটি আরও নির্ভরযোগ্য হয়ে উঠবে। স্ট্যান্ডার্ড হাফ ট্রান্সফর্ম আউটপুট লাইন সেগমেন্ট করে না। শুধুমাত্র তার slাল থিটা এবং স্থানাঙ্ক উৎপত্তি থেকে rho দূরত্ব। তারা হাফ স্পেস অংশ গঠন করে যার উপরে দেখানো হয়েছে। এখানে থিটা অনুভূমিক অক্ষের সাথে মিলে যায়। উজ্জ্বল দাগগুলি ছবিতে সম্ভাব্য লাইন চিহ্নিত করে। লক্ষ্য করুন যে এই ধরনের বেশ কয়েকটি দাগ একটার উপরে আরেকটি অবস্থিত। অবাক হওয়ার কিছু নেই, আমাদের ছবিতে অনেক সমান্তরাল রেখা রয়েছে। তাদের একই থিটা এবং ভিন্ন rho আছে।

ধাপ 3: থেটা হিস্টোগ্রাম গণনা করুন

থেটা হিস্টোগ্রাম গণনা করুন
থেটা হিস্টোগ্রাম গণনা করুন

আসুন এই ধরনের গুচ্ছগুলি সনাক্ত করি। এই উদ্দেশ্যে আমরা একই থেটা দিয়ে হাফ স্পেসের সমস্ত বিন্দুগুলির জন্য রিডিং সংক্ষিপ্ত করব। আপনি দৃষ্টান্তের সাথে সংশ্লিষ্ট হিস্টোগ্রাম দেখতে পাবেন। পরিমাপ সম্পর্কে কয়েকটি নোট। যখন আপনি পিক্সেল কোঅর্ডিনেটে ইমেজ নিয়ে কাজ করেন, তখন X অক্ষ যথারীতি চলে যায়, কিন্তু Y নীচের দিকে নির্দেশ করে তাই কোঅর্ডিনেট উৎপত্তি উপরের বাম কোণে এবং থিটা X অক্ষ থেকে ঘড়ির কাঁটার মাপতে হবে। মনে রাখবেন যে ছবিতে থেটার পুরো ঝাড়ু 180 ডিগ্রী, আপনি আনুমানিক পরীক্ষা করতে পারেন যে 3 টি প্রধান চূড়া ইমেজের 3 টি প্রধান opাল প্রতিনিধিত্ব করে।

ধাপ 4: Rho হিস্টোগ্রাম গণনা করুন

Rho হিস্টোগ্রাম গণনা করুন
Rho হিস্টোগ্রাম গণনা করুন

এখন যেহেতু আমরা সমান্তরাল রেখার main টি প্রধান গুচ্ছ জানি, আসুন তাদের প্রত্যেকটির মধ্যে লাইন আলাদা করি। আমরা একই পদ্ধতির পুনরাবৃত্তি করতে পারি। আসুন হাফ স্পেস থেকে একটি কলাম নেওয়া যাক যা থিটা হিস্টোগ্রামের এক শিখরের সাথে মিলে যায়। পরবর্তী, আমরা আরেকটি হিস্টোগ্রাম গণনা করব যেখানে X অক্ষ rho মান এবং Y - এই rho- এর জন্য সংক্ষিপ্ত রিডিং উপস্থাপন করে। স্পষ্টতই, যোগফল কম হবে তাই এই চার্টটি এত মসৃণ নয়। তা সত্ত্বেও, চূড়াগুলি স্পষ্টভাবে দৃশ্যমান এবং তাদের (7) সংখ্যাটি উৎস চিত্রের সমান্তরাল রেখার সংখ্যার সাথে হুবহু মিলে যায়। দুর্ভাগ্যক্রমে, সমস্ত চার্ট এত নিখুঁত নয়, তবে নীতিটি পরিষ্কার।

ধাপ 5: কেন্দ্রীয় গিঁট খুঁজুন

সেন্ট্রাল নট খুঁজুন
সেন্ট্রাল নট খুঁজুন

যদি আমরা প্রতিটি থিটার জন্য rho হিস্টোগ্রামে কেন্দ্রীয় শিখর গ্রহণ করি, আমরা 3 টি লাইন পাব যা ছবিতে লাল। তাদের ছেদ প্রয়োজনীয় বিন্দু চিহ্নিত করে।

ধাপ 6: 2 বিকল্প থেকে চয়ন করুন

2 বিকল্প থেকে চয়ন করুন
2 বিকল্প থেকে চয়ন করুন
2 বিকল্প থেকে চয়ন করুন
2 বিকল্প থেকে চয়ন করুন

আপনি দেখতে পাচ্ছেন যে প্রতিটি লাইন কেন্দ্রীয় পয়েন্ট থেকে উভয় দিকে যায়। সঠিক অর্ধেক কিভাবে নির্ধারণ করবেন? থেটা 3 নেওয়া যাক। ধরুন আমরা এই লাইনের নিচের অংশ নিই। ছবিটির উপরের ডানদিকের কোণায় 2 টি সবুজ লাইন থেকে ছবির অংশের জন্য আরেকটি হাফ স্পেস গণনা করা যাক। তারপর এর জন্য থিটা হিস্টোগ্রাম তৈরি করুন। আপনি দেখতে পাচ্ছেন যে তৃতীয় চূড়াটি সম্পূর্ণরূপে অদৃশ্য হয়ে গেছে তাই আমরা সঠিক পছন্দ করেছি।

ধাপ 7: বাহ্যিক কোণগুলি নির্ধারণ করুন

বাহ্যিক কোণগুলি নির্ধারণ করুন
বাহ্যিক কোণগুলি নির্ধারণ করুন

এখন আমরা rho হিস্টোগ্রামে প্রথম এবং শেষ শিখরটি ব্যবহার করতে পারি যাতে নীল রেখা আঁকতে পারে যা লাল প্রান্ত কাটা এবং বাকি কোণগুলি চিহ্নিত করে। কাজটি সমাধান করা হয়েছে।

ধাপ 8: অনুশীলনে এটি চেষ্টা করুন

এই নির্দেশের জন্য চিত্রগুলি উপলব্ধি 1.0 ব্যবহার করে তৈরি করা হয়েছিল। এটি একটি মুক্ত সফটওয়্যার যা OpenCV ব্যবহার করে - কম্পিউটার ভিশনের জন্য একটি শক্তিশালী লাইব্রেরি। এছাড়াও এটি WinNB- এর সাথে যুক্ত হতে পারে যা আমার অন্য নির্দেশিকাতে ব্যবহার করা হয়েছিল এভাবে রোবটিক্সের দৃষ্টিশক্তি প্রদান করে। আপনি উভয় প্রোগ্রাম nbsite থেকে ডাউনলোড করতে পারেন। ইনস্টলেশনের জন্য, ডাউনলোড করা exe ফাইলটি চালান। পরে, আপনি উইন্ডোজের স্ট্যান্ডার্ড টুল ব্যবহার করে এটি অপসারণ করতে পারেন। সাইটটিতে কম্পিউটার ভিশন এবং সম্পর্কিত বিষয়গুলি সম্পর্কে সংস্থান রয়েছে। উপলব্ধিতে আপনি 3 ডি পুনর্গঠনের বর্ণিত পদ্ধতি এবং সেইসাথে অনেকগুলি পাবেন। এই প্রোগ্রামের সুবিধা হল যে এটি মধ্যবর্তী তথ্য সহ চূড়ান্ত ফলাফল প্রদান করে। আপনি প্রোগ্রামার না হয়ে কম্পিউটার ভিশন কিভাবে কাজ করে তা নিয়ে গবেষণা করতে পারবেন। ইনপুট হিসাবে, প্রতিটি পদ্ধতি বিশেষভাবে সাধারণ নমুনা নির্বাচন করেছে। অবশ্যই, আপনি আপনার নিজের ব্যবহার করতে পারেন। একটি ফাইল বা কম্পিউটারের ক্যামেরা থেকে ছবি ইনপুট করা সম্ভব। কোন প্রশ্ন বা পরামর্শ সঙ্গে আমার সাথে নির্দ্বিধায় যোগাযোগ করুন।

প্রস্তাবিত: