সুচিপত্র:
- ধাপ 1: প্রয়োজনীয় উপকরণ এবং ফাইল
- ধাপ 2: ধাপ 2: আরও তথ্যের জন্য Voicehat.py ফাইলটি দেখুন
- ধাপ 3: ধাপ 3: ডেমো কোডে ট্রিগার সাউন্ড কোড যুক্ত করুন
- ধাপ 4: ধাপ 4: কোডটি চালান এবং নিশ্চিত করুন যে সবকিছু ঠিক আছে
- ধাপ 5: ধাপ 5: আপনার নিজের.wav ফাইল তৈরি করুন
- ধাপ 6: ধাপ 6: নিশ্চিতকরণ শব্দ যোগ করা?
ভিডিও: Google AIY ভয়েস কিটে ট্রিগার স্টার্ট সাউন্ড যুক্ত করুন: 6 টি ধাপ (ছবি সহ)
2024 লেখক: John Day | [email protected]. সর্বশেষ পরিবর্তিত: 2024-01-30 08:02
এই টিউটোরিয়ালটি বেশ সহজ। আমি সত্যিই গুগল এআইওয়াই ভয়েস কিট উপভোগ করছি, কিন্তু সত্যিই আমার স্বাভাবিক গুগল হোমের মতই তারা নিশ্চিত করে যে তারা সক্রিয়ভাবে শুনছে। এআইওয়াই ভয়েস কিট ইমেজে প্রি-লোড করা কোনও উদাহরণে এটি ডিফল্টরূপে সেটআপ নয়।
আমি স্টক স্টার্টের একটি লিঙ্কও অন্তর্ভুক্ত করছি এবং আমার জুম রেকর্ডার দিয়ে আমার প্রকৃত গুগল হোম থেকে রেকর্ড করা শোরগোল নিশ্চিত করুন।
এখানে আমরা যাচ্ছি-আমার প্রথম নির্দেশযোগ্য!
ধাপ 1: প্রয়োজনীয় উপকরণ এবং ফাইল
- সম্পূর্ণরূপে কার্যকরী গুগল এআইওয়াই ভয়েস কিট-আপনার কিট সেট-আপ করতে অফিসিয়াল এআইওয়াই ভয়েস কিট পৃষ্ঠায় যান।
- SSH, VNC, অথবা মনিটর এবং কীবোর্ডের মাধ্যমে আপনার Pi এর টার্মিনাল অ্যাক্সেস করার ক্ষমতা
- । Pi যখন ভয়েস ইনপুট শুনছে তখন আপনি যে Wav ফাইলটি খেলতে চান-যদি কাস্টম ফাইল ব্যবহার না করেন, তাহলে স্ট্যান্ডার্ড "সেন্ট আর্ট টকিং" ফাইলটি ডাউনলোড করুন অথবা সংযুক্ত লিঙ্ক থেকে ডাউনলোড করুন।
- (Alচ্ছিক) অডিও এডিটর যা ফাইল রূপান্তর করতে পারে এবং তাদের বিট এবং নমুনা হার পরিবর্তন করতে পারে
ধাপ 2: ধাপ 2: আরও তথ্যের জন্য Voicehat.py ফাইলটি দেখুন
গুরুত্বপূর্ণ
আমি আমার ভয়েস কিটে সাম্প্রতিক ছবিটি ব্যবহার করছি না যার মধ্যে ভয়েস এবং ভিশন কিট উভয়ের কোড রয়েছে (যেমন aiyprojects-2018-01-03.img)। আমি ভয়েস কিট শাখা থেকে কোড ব্যবহার করছি যা Google AIY Raspbian GitHub এ পাওয়া যাবে। আমার ব্যক্তিগত মতামত হল ভয়েস কিট শাখাটি সহজভাবে ব্যবহার করা এবং যখন আপনি আপনার ভয়েস কিট নিয়ে কাজ করছেন তখন ভিশন কোডটি মোকাবেলা করার প্রয়োজন নেই।
সরানো…
এই ধাপটি সম্পূর্ণ বাধ্যতামূলক নয়, তবে এটি আপনাকে দেখাবে যে গুগল এই কাজটি করার জন্য নির্দেশনা কোথায় দাফন করেছে যদি আপনি এটিকে আরও একধাপ এগিয়ে নিতে চান বা বুঝতে চান যে কোডটি আমি কেন যোগ করছি।
pi@রাস্পবেরি: সিডি AIY- ভয়েস-কিট-পাইথন/src/aiy/
তারপরে আমরা সেই ফোল্ডারে voicehat.py ফাইলটি পরীক্ষা করতে যাচ্ছি:
pi@রাস্পবেরি: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py
সংযুক্ত ছবিটি দেখায় যে আপনি কোথায় স্ট্যাটাস ইউআই এবং ট্রিগার চলাকালীন শব্দ কীভাবে ব্যবহার করবেন সে সম্পর্কে জানতে পারবেন।
ঠিক আছে, এখন এই জিনিসটি কাজ করার জন্য উদাহরণ ফাইলগুলির মধ্যে কিছু কোড যোগ করি।
ধাপ 3: ধাপ 3: ডেমো কোডে ট্রিগার সাউন্ড কোড যুক্ত করুন
প্রথমে, AIY- ভয়েস-কিট-পাইথন ফোল্ডারে নেভিগেট করুন এবং সোর্স কোডটি চালান
সিডি AIY- ভয়েস-কিট-পাইথন
উৎস env/bin/সক্রিয় করুন
সিডি src
তারপরে 'sudo nano' ব্যবহার করুন 'assistant_grpc_demo.py' অথবা 'Assistant_library_demo.py'
দুটি ফাইলের মধ্যে পার্থক্য হল যে Assistant_grpc_demo.py গুগল অ্যাসিস্ট্যান্ট ট্রিগার করার জন্য বোতাম ব্যবহার করে এবং গুগল অ্যাসিস্ট্যান্ট ট্রিগার করতে Assistant_library_demo.py অ্যাক্টিভেশন শব্দ "ওকে, গুগল" ব্যবহার করে।
এই দুটি ফাইলের জন্য আপনাকে কেবল কোডের একটি লাইন যোগ করতে হবে:
status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')
এটি ধরে নেয় যে আপনি/home/pi/ফোল্ডারে আপনার শুরুর শব্দটি রেখেছেন এবং এর নাম দিয়েছেন googlestart.wav। আপনি আপনার ফাইলের নাম এবং আপনি যেখানেই থাকুন না কেন তার ভিত্তিতে এটি পরিবর্তন করুন।
আমরা যে কোডটির সন্ধান করছি তা নীচে রয়েছে:
status_ui.status ('শোনা')
আমরা কোডের সেই লাইনটির আগে আমাদের কোডের নতুন লাইন যোগ করতে চাই …
'Assistant_library_demo.py' উদাহরণের জন্য এটি এখানে পাওয়া যাবে:
elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:
# এবং এখন আমাদের কোড status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('শোনা') যোগ করুন
'Assistant_grpc_demo.py' উদাহরণের জন্য এটি এখানে পাওয়া যাবে:
button.wait_for_press ()
# এবং এখন আমাদের কোড status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ('শোনা') যোগ করুন
এটি ধরে নেয় যে আপনি/home/pi/ফোল্ডারে আপনার শুরুর শব্দটি রেখেছেন এবং এর নাম দিয়েছেন googlestart.wav। আপনি আপনার ফাইলের নাম এবং আপনি যেখানেই থাকুন না কেন তার ভিত্তিতে এটি পরিবর্তন করুন।
সবকিছু সংরক্ষণ করতে CTRL-X & Y চাপুন।
*** দ্রষ্টব্য: আমি একটু বোকা কিছু খুঁজে পেয়েছি। 'Assistant_library_demo.py' এর জন্য ট্রিগার সাউন্ড যোগ করলে মনে হয় বক্তৃতা শনাক্তকরণের কার্যক্রমে কোন পার্থক্য নেই। যদিও 'Assistant_grpc_demo.py' এর জন্য, মনে হয় যখন আপনার ট্রিগার সাউন্ড বাস্তবায়িত হয় তখন এটি আপনার প্রথম বা দুইটি শব্দ বন্ধ করে দেয়। পুরোপুরি নিশ্চিত না কেন। এখনও এটা চিন্তা করার চেষ্টা করছে।
ধাপ 4: ধাপ 4: কোডটি চালান এবং নিশ্চিত করুন যে সবকিছু ঠিক আছে
পিআই@রাস্পবেরি: সিডি এআইওয়াই-ভয়েস-কিট-পাইথন
এবং ভার্চুয়ালেনভ লোড করুন
pi@রাস্পবেরি: ~/AIY-voice-kit-python $ source env/bin/activate
এবং এটি চালান!
(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_library_demo.py
অথবা
(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_grpc_demo.py
এখন বলুন "ঠিক আছে, গুগল" বা বোতাম টিপুন এবং দেখুন এটি কাজ করে কিনা!
আপনার নিজস্ব কাস্টম ফাইল এবং আপনার.wav ফাইলের জন্য উপযুক্ত বিট এবং নমুনা হার থাকলে পরবর্তী পৃষ্ঠা আপনাকে সাহায্য করবে
ধাপ 5: ধাপ 5: আপনার নিজের.wav ফাইল তৈরি করুন
আপনি যদি স্ট্যান্ডার্ড গুগল হোম স্টার্ট সাউন্ডের আমার.wav ফাইলটি ব্যবহার করতে আগ্রহী না হন, তাহলে আপনাকে নিজের.wav ফাইল তৈরি করতে হবে। আমার জন্য কাজ করার জন্য সঠিক বিট এবং নমুনা হার পেতে কিছুটা পরীক্ষা এবং ত্রুটি লেগেছে।
আমি আমার সমস্ত এডিটিং (ছবিতে) করার জন্য লজিক প্রো এক্স ব্যবহার করেছি, যা সঙ্গীত তৈরি এবং উৎপাদনের জন্য একটি সম্পূর্ণরূপে DAW। আমি দুটি বিকল্প খুঁজে পেয়েছি যা উপযুক্ত হতে পারে সুইচ বা মিডিয়াহিউম্যান অডিও কনভার্টার। আমি অনুমান করি আপনি যদি গ্যারেজব্যান্ডের সাথে এটি করতে পারেন যদি আপনার একটি ম্যাক থাকে তবে আমি এটি চেষ্টা করি নি।
ডেমো কোডের সাথে কাজ করার জন্য আপনার ফাইলের তিনটি মূল অংশ রয়েছে।
- একটি MONO অডিও ফাইল হতে হবে
- নমুনা হার 32000 হতে হবে
- . Wav ফাইল হতে হবে
- (Alচ্ছিক) 16 বিট রেজোলিউশন আমার জন্য সেরা কাজ করেছে
ধাপ 6: ধাপ 6: নিশ্চিতকরণ শব্দ যোগ করা?
কারও কোন চিন্তা থাকলে এখানেই আমি আটকে আছি। যদি সিস্টেমটি সাধারণ গুগল হোমের মতো ভয়েস ইনপুটকে স্বীকৃতি দেয় তবে আমি নিশ্চিতকরণ শব্দ যুক্ত করতে চাই।
আমি আপনার সুবিধার জন্য নিচে স্টক কনফার্মেশন নয়েজ সংযুক্ত করেছি।
উপভোগ করুন!
প্রস্তাবিত:
সাউন্ড কোয়ালিটি উন্নত করতে এক্সটার্নাল স্পিকার যুক্ত করুন: ৫ টি ধাপ
সাউন্ড কোয়ালিটি উন্নত করার জন্য একটি এক্সটার্নাল স্পিকার যুক্ত করুন: এই সুন্দর ছোট্ট ঘড়ির রেডিও থেকে সাউন্ড কোয়ালিটি ছিল ভয়ঙ্কর! রেডিও সম্পর্কে অন্য সব কিছুই দারুণ, ব্যবহারের সহজতা, ফোন চার্জিং, ডিসপ্লে ইত্যাদি। যত বড় তত ভাল
আপনার নিজস্ব আইআর সাউন্ড, ভয়েস ট্রান্সমিটার তৈরি করুন: 6 টি ধাপ
আপনার নিজস্ব আইআর সাউন্ড, ভয়েস ট্রান্সমিটার তৈরি করুন: আমার প্রজেক্ট ব্যবহার করার মূল নীতি হল ইনফ্রারেড (লেজার) কম্পনের ফলে সৃষ্ট শব্দ, যা তখন রিসিভার সার্কিটের ইনফ্রারেড রিসিভার ডায়োডে একটি ইনফ্রারেড কম্পন সংকেত পায় এবং সিগন্যালটি ডিমোডুলেটেড হয় সাউন্ড এটেনু অর্জন করুন
রেডিও অক্স জ্যাক মেরামত করুন / ড্যাশের পিছনে মিডিয়া ব্লুটুথ রিসিভার যুক্ত করুন: 6 টি ধাপ (ছবি সহ)
রেডিও অক্স জ্যাক মেরামত করুন / ড্যাশের পিছনে মিডিয়া ব্লুটুথ রিসিভার যুক্ত করুন: আমি সম্প্রতি লক্ষ্য করেছি যে আমার 2013 সিলভেরাডো অক্স জ্যাকটি আলগা ছিল। এটি অবাক হওয়ার মতো নয় কারণ আমি এটি প্রায়শই ব্যবহার করি এবং জ্যাক থেকে ঝুলন্ত অক্স কর্ডটি ছেড়ে যাই। এটি ঠিক করার জন্য, আমার কেবল ড্যাশ থেকে কয়েকটি প্যানেল সরানো, অপসারণ এবং আপা নেওয়া দরকার
একটি নিকন এসসি -28 টিটিএল ক্যাবলে একটি পিসি সিঙ্ক জ্যাক যুক্ত করুন (ক্যামেরা ফ্ল্যাশের জন্য অটো সেটিংস ব্যবহার করুন এবং ক্যামেরা ফ্ল্যাশ বন্ধ করুন !!): 4 টি ধাপ
একটি নিকন এসসি -28 টিটিএল ক্যাবলে একটি পিসি সিঙ্ক জ্যাক যুক্ত করুন (ক্যামেরা ফ্ল্যাশ অন করার জন্য অটো সেটিংস ব্যবহার করুন এবং ক্যামেরা ফ্ল্যাশ বন্ধ করুন !!): এই নির্দেশে আমি আপনাকে দেখাবো কিভাবে সেই বিরক্তিকর মালিকানা 3 পিন টিটিএল সংযোগকারীগুলিকে সরিয়ে ফেলতে হয় একটি নিকন SC-28 অফ ক্যামেরা টিটিএল তারের পাশে এবং এটি একটি আদর্শ পিসি সিঙ্ক সংযোগকারী দিয়ে প্রতিস্থাপন করুন। এটি আপনাকে একটি ডেডিকেটেড ফ্ল্যাশ ব্যবহার করতে দেবে
যেকোন স্পিকারের জন্য সাউন্ড রিঅ্যাক্টিভ এলইডি যুক্ত করুন !: ৫ টি ধাপ
যেকোনো স্পিকারের জন্য সাউন্ড রিঅ্যাক্টিভ এলইডি যুক্ত করুন! এলইডি আকারের (সাধারণত 5 মিমি) ড্রিল বিট লিটল রাস্প আপনার এলইডি স্পিকারের সাথে ফিট করার জন্য এলইডি এর গর্ত ফাইল করতে, আমি ক্রিয়েটিভ ট্র্যাভেলসাউন্ড -স্পিকার স্ক্রু ড্রাইভার ব্যবহার করেছি (যদি