ऑडिओ फाईल टू टेक्स्ट हा अनुप्रयोग मानवी भाषणातील मजकूरासह ध्वनी फायली ओळखण्यासाठी डिझाइन केलेला आहे (मजकूरात भाषण करण्यासाठी). अनुप्रयोग अद्याप भाषण रेकॉर्ड करण्यासाठी नाही (यासाठी इतर अनुप्रयोग वापरा, उदाहरणार्थ, मानक व्हॉइस रेकॉर्डर).
बाह्य आवाज (स्पीकरचा आवाज वगळता) गाणी, व्हिडिओ आणि इतर कोणत्याही रेकॉर्डिंगमधील शब्द ओळखण्यासाठी आम्ही वापरण्याची शिफारस करत नाही, या प्रकरणात मान्यता बहुधा असमाधानकारक असेल.
जेव्हा स्पीकर रेकॉर्डिंग डिव्हाइसशी शक्य तितक्या जवळ असतो आणि बाह्य आवाज न घेता उच्च आवाज गुणवत्तेसह बनविलेले व्हॉइस रेकॉर्डिंग ओळखण्यासाठी
आम्ही शिफारस करतो
अनुप्रयोग वैशिष्ट्ये:
- लहान ऑडिओ रेकॉर्डिंगची ओळख (1 मिनिटापर्यंत)
- लांब ऑडिओ रेकॉर्डिंगची ओळख (1 मिनिटापेक्षा जास्त)
- हे बहुतेक ऑडिओ स्वरूप - एमपी 3, ओजीजी (ऑपस कोडेक), एएसी, एमपीईजी, एएमआर, डब्ल्यूएव्ही, एम 4 ए, एफएलएसी आणि इतरांकडून मान्यता समर्थित करते.
परंतु आम्ही .FLAC
वापरण्याची शिफारस करतो
- 120 भाषांकडून मान्यता समर्थन
- काही भाषांसाठी “ऑटो विरामचिन्हे” उपलब्ध आहे.
- ओळखलेला मजकूर अनुप्रयोगात जतन केला आहे.
- कोणत्याही उपलब्ध फोन पद्धतींसह मजकूर "सामायिक" करण्याची क्षमता
- मजकूर व्यक्तिचलितपणे संपादित करण्याची क्षमता
- मजकूर स्वरूपात निर्यात करण्याची क्षमता (Android <10 आवृत्तीसाठी)
- अन्य अनुप्रयोगांकडून "सामायिक करा" नंतर ऑडिओ फायली ओळखणे (उदाहरणार्थ, व्हॉट्स अॅप - व्हॉईस संदेश. आणि फायली पाहण्यासाठी अनुप्रयोग).
ते कसे कार्य करते:
1) आपण एखाद्या व्यक्तीची ऑडिओ फाइल निवडा
२) ओळख भाषा आणि अतिरिक्त सेटिंग्ज निवडा (निवडलेल्या भाषेसाठी काही असल्यास)
3) “प्रारंभ” बटण दाबा
)) ऑडिओ फाईल सर्व्हरवर डाउनलोड केली जाते आणि त्याचे स्वरूपन एफएलएसीमध्ये रूपांतरित केले जाते
)) रूपांतरणानंतर, स्पीच-टू-टेक्स्टला निवेदन दिले जाते आणि सर्व्हर ओळख परिणाम देतो
स्पीच रेकग्निशन गूगलचे क्लाउड सोल्यूशन - मजकूरासाठी भाषण, ज्यास वेळेच्या युनिटच्या मान्यतेसाठी पैसे आवश्यक असतात, म्हणून अनुप्रयोग विनामूल्य नाही आणि प्रत्येक ओळखीसाठी आम्हाला वापरकर्त्यांना शुल्क आकारण्यास भाग पाडले जाते. कृपया समजुतीने वागवा.