מנוע Speech-to-Text שאומן ספציפית על עברית.
Nivision משתמשת במנוע speech-to-text שאומן על דיבור עברי - לא Whisper גנרי, לא תרגום מאנגלית. דיוק גבוה על שיחות נקיות, ועמידות לאודיו מאתגר.
הטכנולוגיה שהופכת אודיו עברי לטקסט מובן - הבסיס של כל ניתוח שיחה.
Speech-to-Text (STT, או 'זיהוי דיבור') היא הטכנולוגיה הבסיסית שהופכת קובץ אודיו לטקסט. STT עברי קשה משמעותית מ-STT אנגלי - עברית היא שפה דחוסה עם מורפולוגיה עשירה, ובאודיו של מוקדים מתערבבים בה ביטויי סלנג, מילים באנגלית, ולעיתים גם ערבית או רוסית. מנוע STT איכותי לעברית חייב להיות מאומן על דיבור עברי טבעי - לא להסתמך על תרגום ממודל אנגלי.
ארבעה גורמים שמייצרים STT עברי ברמה תפעולית:
STT עברי איכותי הוא יותר ממודל יחיד. הוא דורש שילוב של אקוסטיקה, לשון, סביבת שיחה ודרישות תפעוליות אמיתיות.
מודל אקוסטי + לשוני שאומן על עברית
המנוע מבוסס על שילוב של מודל אקוסטי (איך נשמעת עברית) ומודל לשוני (איך עברית מורכבת תחבירית). שניהם אומנו על דיבור עברי טבעי בנפח גדול.
תמיכה במגוון מבטאים ודוברים
ילידיים, עולים, דוברי עברית כשפה שנייה - המודל אומן על מגוון רחב, ומטפל באוכלוסיית הדוברים האמיתית של מוקדים ישראלים.
עמידות לרעש רקע ואודיו דחוס
אודיו של שיחות טלפון דחוס משמעותית מהקלטות סטודיו. המנוע מטופל בעיבוד מקדים, ומאומן על אודיו אמיתי כדי להתמודד עם פערי איכות.
תמלול post-call מהיר בקנה מידה
Nivision מתמללת בעיבוד post-call: כל שיחה זמינה תוך דקות מסיומה. אפשר לתמלל גם נפחי batch גדולים של הקלטות historic באותה איכות. תמלול בזמן אמת תוך-שיחה (real-time streaming) נמצא ב-roadmap.
מי זקוק ל-Speech-to-Text ייעודי לעברית?
STT עברי איכותי הוא תשתית. הוא רלוונטי בכל מקום שבו צריך להפוך אודיו עברי לטקסט שאפשר לפעול עליו - לא רק לתעד.
- מוקדים שמתמללים שיחות לצורך ניתוח או QA
- ארגוני ביטוח ופיננסים שמחויבים לתיעוד לצורך רגולציה
- צוותי מוצר שמנתחים שיחות לקוח לזיהוי בעיות
- צוותי AI שצריכים שכבת STT מדויקת בשפה ובדומיין שלהם
- מערכות פנימיות שצריכות תמלול אוטומטי של שיחות עברית
שלוש קטגוריות של מנועי STT עבריים - מי מתאים למוקדים?
מי שמחפש STT לעברית פוגש שלוש קטגוריות כלים, וההתאמה תלויה בדיוק הנדרש, בנפח, ובסביבה התפעולית.
ההשוואה הבאה היא ברמת קטגוריה, לא ברמת מוצר ספציפי.
| קטגוריית מנוע STT | דיוק על שיחות מוקד בעברית | הפרדת דוברים | טיפול באודיו של טלפוניה | אינטגרציה תפעולית | תמיכה מקומית | התאמה מומלצת |
|---|---|---|---|---|---|---|
| מודלים גנריים open-source (Whisper-class) | בינוני, תלוי בגרסה | לא מובנה | מוגבל | ידרוש פיתוח | קהילה | פרויקטי R&D ופיתוח עצמי |
| שירותי STT ענן בינלאומיים | טוב על אודיו נקי, יורד על אודיו מוקדי | תוסף | מוגבל | API בלבד | כללית, לא מקומית | פרויקטים שזקוקים ל-API לזיהוי דיבור גנרי |
| STT ייעודי למוקדים בעברית (כמו Nivision) | גבוה, בנוי לאודיו מוקד | מובנה | כן | פלטפורמה שלמה | ישראלית, ייעודית למוקדים | מוקדים שצריכים פתרון תפעולי מלא |
התוצאה
- תמלילים מדויקים שמיועדים גם לבני אדם וגם ל-AI
- הפרדת דוברים אוטומטית בלי קונפיגורציה
- תמלילים זמינים תוך דקות מסיום השיחה - להתראות ולדשבורד שמתעדכן כל הזמן
- תמלול batch לארכיון שיחות historic
- תשתית STT שלא צריך לתחזק ולעדכן עצמאית
- מנוע שמשתפר עם הזמן על דומיין השיחות שלכם
שאלות נפוצות
הפכו את השיחות שלכם לפעולה.
ראו את Nivision מנתחת שיחות כמו אלה שהצוות שלכם מנהל כל יום. הדגמה של 30 דקות, בלי שקפים.