সুচিপত্র:

Google AIY ভয়েস কিটে ট্রিগার স্টার্ট সাউন্ড যুক্ত করুন: 6 টি ধাপ (ছবি সহ)
Google AIY ভয়েস কিটে ট্রিগার স্টার্ট সাউন্ড যুক্ত করুন: 6 টি ধাপ (ছবি সহ)

ভিডিও: Google AIY ভয়েস কিটে ট্রিগার স্টার্ট সাউন্ড যুক্ত করুন: 6 টি ধাপ (ছবি সহ)

ভিডিও: Google AIY ভয়েস কিটে ট্রিগার স্টার্ট সাউন্ড যুক্ত করুন: 6 টি ধাপ (ছবি সহ)
ভিডিও: Session 11 | Core Java : First Java Program | Sonu Sir 2024, নভেম্বর
Anonim
Image
Image
পদক্ষেপ 2: আরও তথ্যের জন্য Voicehat.py ফাইলটি দেখুন
পদক্ষেপ 2: আরও তথ্যের জন্য Voicehat.py ফাইলটি দেখুন

এই টিউটোরিয়ালটি বেশ সহজ। আমি সত্যিই গুগল এআইওয়াই ভয়েস কিট উপভোগ করছি, কিন্তু সত্যিই আমার স্বাভাবিক গুগল হোমের মতই তারা নিশ্চিত করে যে তারা সক্রিয়ভাবে শুনছে। এআইওয়াই ভয়েস কিট ইমেজে প্রি-লোড করা কোনও উদাহরণে এটি ডিফল্টরূপে সেটআপ নয়।

আমি স্টক স্টার্টের একটি লিঙ্কও অন্তর্ভুক্ত করছি এবং আমার জুম রেকর্ডার দিয়ে আমার প্রকৃত গুগল হোম থেকে রেকর্ড করা শোরগোল নিশ্চিত করুন।

এখানে আমরা যাচ্ছি-আমার প্রথম নির্দেশযোগ্য!

ধাপ 1: প্রয়োজনীয় উপকরণ এবং ফাইল

  1. সম্পূর্ণরূপে কার্যকরী গুগল এআইওয়াই ভয়েস কিট-আপনার কিট সেট-আপ করতে অফিসিয়াল এআইওয়াই ভয়েস কিট পৃষ্ঠায় যান।
  2. SSH, VNC, অথবা মনিটর এবং কীবোর্ডের মাধ্যমে আপনার Pi এর টার্মিনাল অ্যাক্সেস করার ক্ষমতা
  3. । Pi যখন ভয়েস ইনপুট শুনছে তখন আপনি যে Wav ফাইলটি খেলতে চান-যদি কাস্টম ফাইল ব্যবহার না করেন, তাহলে স্ট্যান্ডার্ড "সেন্ট আর্ট টকিং" ফাইলটি ডাউনলোড করুন অথবা সংযুক্ত লিঙ্ক থেকে ডাউনলোড করুন।
  4. (Alচ্ছিক) অডিও এডিটর যা ফাইল রূপান্তর করতে পারে এবং তাদের বিট এবং নমুনা হার পরিবর্তন করতে পারে

ধাপ 2: ধাপ 2: আরও তথ্যের জন্য Voicehat.py ফাইলটি দেখুন

গুরুত্বপূর্ণ

আমি আমার ভয়েস কিটে সাম্প্রতিক ছবিটি ব্যবহার করছি না যার মধ্যে ভয়েস এবং ভিশন কিট উভয়ের কোড রয়েছে (যেমন aiyprojects-2018-01-03.img)। আমি ভয়েস কিট শাখা থেকে কোড ব্যবহার করছি যা Google AIY Raspbian GitHub এ পাওয়া যাবে। আমার ব্যক্তিগত মতামত হল ভয়েস কিট শাখাটি সহজভাবে ব্যবহার করা এবং যখন আপনি আপনার ভয়েস কিট নিয়ে কাজ করছেন তখন ভিশন কোডটি মোকাবেলা করার প্রয়োজন নেই।

সরানো…

এই ধাপটি সম্পূর্ণ বাধ্যতামূলক নয়, তবে এটি আপনাকে দেখাবে যে গুগল এই কাজটি করার জন্য নির্দেশনা কোথায় দাফন করেছে যদি আপনি এটিকে আরও একধাপ এগিয়ে নিতে চান বা বুঝতে চান যে কোডটি আমি কেন যোগ করছি।

pi@রাস্পবেরি: সিডি AIY- ভয়েস-কিট-পাইথন/src/aiy/

তারপরে আমরা সেই ফোল্ডারে voicehat.py ফাইলটি পরীক্ষা করতে যাচ্ছি:

pi@রাস্পবেরি: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

সংযুক্ত ছবিটি দেখায় যে আপনি কোথায় স্ট্যাটাস ইউআই এবং ট্রিগার চলাকালীন শব্দ কীভাবে ব্যবহার করবেন সে সম্পর্কে জানতে পারবেন।

ঠিক আছে, এখন এই জিনিসটি কাজ করার জন্য উদাহরণ ফাইলগুলির মধ্যে কিছু কোড যোগ করি।

ধাপ 3: ধাপ 3: ডেমো কোডে ট্রিগার সাউন্ড কোড যুক্ত করুন

ধাপ 3: ডেমো কোডে ট্রিগার সাউন্ড কোড যুক্ত করুন
ধাপ 3: ডেমো কোডে ট্রিগার সাউন্ড কোড যুক্ত করুন

প্রথমে, AIY- ভয়েস-কিট-পাইথন ফোল্ডারে নেভিগেট করুন এবং সোর্স কোডটি চালান

সিডি AIY- ভয়েস-কিট-পাইথন

উৎস env/bin/সক্রিয় করুন

সিডি src

তারপরে 'sudo nano' ব্যবহার করুন 'assistant_grpc_demo.py' অথবা 'Assistant_library_demo.py'

দুটি ফাইলের মধ্যে পার্থক্য হল যে Assistant_grpc_demo.py গুগল অ্যাসিস্ট্যান্ট ট্রিগার করার জন্য বোতাম ব্যবহার করে এবং গুগল অ্যাসিস্ট্যান্ট ট্রিগার করতে Assistant_library_demo.py অ্যাক্টিভেশন শব্দ "ওকে, গুগল" ব্যবহার করে।

এই দুটি ফাইলের জন্য আপনাকে কেবল কোডের একটি লাইন যোগ করতে হবে:

status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')

এটি ধরে নেয় যে আপনি/home/pi/ফোল্ডারে আপনার শুরুর শব্দটি রেখেছেন এবং এর নাম দিয়েছেন googlestart.wav। আপনি আপনার ফাইলের নাম এবং আপনি যেখানেই থাকুন না কেন তার ভিত্তিতে এটি পরিবর্তন করুন।

আমরা যে কোডটির সন্ধান করছি তা নীচে রয়েছে:

status_ui.status ('শোনা')

আমরা কোডের সেই লাইনটির আগে আমাদের কোডের নতুন লাইন যোগ করতে চাই …

'Assistant_library_demo.py' উদাহরণের জন্য এটি এখানে পাওয়া যাবে:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# এবং এখন আমাদের কোড status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('শোনা') যোগ করুন

'Assistant_grpc_demo.py' উদাহরণের জন্য এটি এখানে পাওয়া যাবে:

button.wait_for_press ()

# এবং এখন আমাদের কোড status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ('শোনা') যোগ করুন

এটি ধরে নেয় যে আপনি/home/pi/ফোল্ডারে আপনার শুরুর শব্দটি রেখেছেন এবং এর নাম দিয়েছেন googlestart.wav। আপনি আপনার ফাইলের নাম এবং আপনি যেখানেই থাকুন না কেন তার ভিত্তিতে এটি পরিবর্তন করুন।

সবকিছু সংরক্ষণ করতে CTRL-X & Y চাপুন।

*** দ্রষ্টব্য: আমি একটু বোকা কিছু খুঁজে পেয়েছি। 'Assistant_library_demo.py' এর জন্য ট্রিগার সাউন্ড যোগ করলে মনে হয় বক্তৃতা শনাক্তকরণের কার্যক্রমে কোন পার্থক্য নেই। যদিও 'Assistant_grpc_demo.py' এর জন্য, মনে হয় যখন আপনার ট্রিগার সাউন্ড বাস্তবায়িত হয় তখন এটি আপনার প্রথম বা দুইটি শব্দ বন্ধ করে দেয়। পুরোপুরি নিশ্চিত না কেন। এখনও এটা চিন্তা করার চেষ্টা করছে।

ধাপ 4: ধাপ 4: কোডটি চালান এবং নিশ্চিত করুন যে সবকিছু ঠিক আছে

পিআই@রাস্পবেরি: সিডি এআইওয়াই-ভয়েস-কিট-পাইথন

এবং ভার্চুয়ালেনভ লোড করুন

pi@রাস্পবেরি: ~/AIY-voice-kit-python $ source env/bin/activate

এবং এটি চালান!

(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_library_demo.py

অথবা

(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_grpc_demo.py

এখন বলুন "ঠিক আছে, গুগল" বা বোতাম টিপুন এবং দেখুন এটি কাজ করে কিনা!

আপনার নিজস্ব কাস্টম ফাইল এবং আপনার.wav ফাইলের জন্য উপযুক্ত বিট এবং নমুনা হার থাকলে পরবর্তী পৃষ্ঠা আপনাকে সাহায্য করবে

ধাপ 5: ধাপ 5: আপনার নিজের.wav ফাইল তৈরি করুন

ধাপ 5: আপনার নিজের.wav ফাইল তৈরি করুন
ধাপ 5: আপনার নিজের.wav ফাইল তৈরি করুন

আপনি যদি স্ট্যান্ডার্ড গুগল হোম স্টার্ট সাউন্ডের আমার.wav ফাইলটি ব্যবহার করতে আগ্রহী না হন, তাহলে আপনাকে নিজের.wav ফাইল তৈরি করতে হবে। আমার জন্য কাজ করার জন্য সঠিক বিট এবং নমুনা হার পেতে কিছুটা পরীক্ষা এবং ত্রুটি লেগেছে।

আমি আমার সমস্ত এডিটিং (ছবিতে) করার জন্য লজিক প্রো এক্স ব্যবহার করেছি, যা সঙ্গীত তৈরি এবং উৎপাদনের জন্য একটি সম্পূর্ণরূপে DAW। আমি দুটি বিকল্প খুঁজে পেয়েছি যা উপযুক্ত হতে পারে সুইচ বা মিডিয়াহিউম্যান অডিও কনভার্টার। আমি অনুমান করি আপনি যদি গ্যারেজব্যান্ডের সাথে এটি করতে পারেন যদি আপনার একটি ম্যাক থাকে তবে আমি এটি চেষ্টা করি নি।

ডেমো কোডের সাথে কাজ করার জন্য আপনার ফাইলের তিনটি মূল অংশ রয়েছে।

  1. একটি MONO অডিও ফাইল হতে হবে
  2. নমুনা হার 32000 হতে হবে
  3. . Wav ফাইল হতে হবে
  4. (Alচ্ছিক) 16 বিট রেজোলিউশন আমার জন্য সেরা কাজ করেছে

ধাপ 6: ধাপ 6: নিশ্চিতকরণ শব্দ যোগ করা?

কারও কোন চিন্তা থাকলে এখানেই আমি আটকে আছি। যদি সিস্টেমটি সাধারণ গুগল হোমের মতো ভয়েস ইনপুটকে স্বীকৃতি দেয় তবে আমি নিশ্চিতকরণ শব্দ যুক্ত করতে চাই।

আমি আপনার সুবিধার জন্য নিচে স্টক কনফার্মেশন নয়েজ সংযুক্ত করেছি।

উপভোগ করুন!

প্রস্তাবিত: