לחזרה למעלה לחצו כאן

ממשק משתמש מבוסס קול (VUI) – נעים להכיר...

טכנולוגיית זיהוי הקול (Voice Recognition) זמינה ומוכרת כבר שנים רבות במהלכם השתפרה משמעותית ועדיין איננה משולבת באופן משמעותי ממשקי המשתמש של אפליקציות מכשירי טלפון חכם למרות שהיא משולבת כחלק אינטגרלי במערכת ההפעלה. האם הגיע הזמן לפריצה הגדולה שלה ? הכירו את עקרונות הטכנולוגיה...

07/07/2016

עקרונות ממשק משתמש מבוסס קול

Voice User Interfaceממשקי משתמש מבוססים קול (Voice User Interface או בקיצור VUI) מאפשרים למשתמשים לתקשר עם מערכת מחשב באמצעות קול/דיבור. בבסיסה של הטכנולוגיה היכולת לפענח את הקול ולהבין את משמעותו (Voice Recognition) ואבני הבסיס הנן הנחיות לביצוע (Command), הכתבה (Dictation), הקראה (Respond) ואימות (Identification).

לממשקי משתמש מבוססי קול מספר יתרונות ובהם:

1. יכולת לשמר את הידיים פנויות (Hands Free) ואת המבט פנוי (Eyes Free).

2. פריצת מגבלות גודל המסך בתכנון חווית משתמש.

3. חוסר הצורך להיות צמוד פיזית למכשיר לתפעול האפליקציה.

4. פתרון לבעלי מוגבלויות מוטוריות.

5. יכולת היכרות וזיהוי פרסונלי של הדובר והתאמת תפקוד המערכת לצרכיו היחודיים.

מכשירי טלפונים חכמים והבשורה שהביאו

מכשירי הטלפון החכמים הביאו עמם בשורה משמעותית לשימוש שממשק משתמש מבוסס קול וזאת באמצעות שילוב של התשתיות הטכנולוגיות הנדרשות בבסיס מערכות ההפעלה (כדוגמת Android, iOS ו- Windows) ולמעשה מאפשרים למפתחי אפליקציות לשלב מרכיבי ממשק משתמש מבוססי קול בקלות.

יצרניות מערכת ההפעלה נמצאות במרוץ ליצירת עוזר אישי וירטואלי אשר יאפשר לבעל המכשיר לקיים דיאלוג עם אפליקציה שתדע להבין דיבור ולספק מידע באמצעות דיבור מלאכותי בהתאם. Apple מפתחת את Siri, Microsoft את Cortana וגוגל את Google Now ואין ספק שמרוץ זה תורם להתפתחות המשמעותית של טכנולוגיות זיהוי הקול המשולבות במערכות ההפעלה שלהן.

עיצוב ממשק משתמש מבוסס קול

חווית המשתמש מבוסס קול שונה לחלוטין מחווית המשתמש הרגילה וממשק המשתמש בעל מאפיינים שונים מהמוכר. להלן מספר דוגמאות:

1. בעוד שמעצבי ממשק המשתמש האפליקטיבי המותאם להקלדה ומסכי מגע "נאבקים" להגדיר מנגוני ניווט, כפתורים והנחיות שיותאמו לגודל המסך הרי שכאשר מתכננים ממשק משתמש מבוסס קול לא קיימת מגבלה שכזו. שטח הדורשים מספר כפתורי פעולה יכול להתמצות למצב של פקודה קולית ומגוון הפקודות הקוליות יכול להיות רחב מאוד.

2. החיווי על הצלחת פעולות/כישלון פעולות הנו לרוב חיווי קולי בנושא למשוב ויזואלי בכדי לשמר את הכלל של Hands & Eyes Free.

3. מילוי טפסים הופך ממילוי של שדות לסדרת של שאלות עליהן המשתמש מתבקש לתת מענה קולי.

4. הכניסה למערכת יכולה להתבצע מול אימות חתימת קול ולא רק זיהוי סיסמה שנאמרת.

מהפכה או תוספת פונקציונאלית נחמדה?

פתחנו את המאמר באמירה כי הטכנולוגיה זמינה כבר שנים רבות ואכן היא הייתה זמינה אך סבלה ממגוון רחב של בעיות החל מרמת שגיאות פיענוח קול גבוהה, תמיכה במגוון שפות וכדומה ולכן ישומים שונים שהתבססו על קול נכשלו והמשתמשים "הצביעו ברגליים".

נראה כי בשנים האחרונות נעשתה קפיצה טכנולוגית משמעותית ולראיה השקעות האתר של Google, Microsoft ו- Apple בפיתוח אפליקציית העוזר האישי הוירטואלי המבוססת כולה על ממשק קולי.

קשה להעריך האם בשנה הקרובה יעשה המעבר לשימוש בממשקים קוליים אך ההנחה שזה יקרה בשנים הקרובות. להערכתנו לא מדובר בשינוי של חווית המשתמש התפעולית בלבד אלא הרבה מעבר לכך.

בכדי להסביר את עמדתנו נבחר לדוגמא אפליקציה להיכרויות אשר מבוססת על הצגת הפרופיל בקולו האמיתי של המשתמש והתכתבות מבוססת קול במקום הקלדה בטרם החליפו הצדדים פרטים. רמת ההיכרות בטרם החלפת פרטי הקשר אינטימית וגבוהה ולכושר הדיבור ישנה משמעות אדירה שבעבר לא הייתה קיימת.

ממשקי משתמש מבוססי קול אינם רלוונטיים אך ורק לעולם האפליקציות למכשירי טלפון חכם ובחרנו בסרטון הבא להמחיש את החוויה בעת שימוש במעלית:

 

פנו אלינו למידע נוסף

טלפון:
מידע כללי:
מכתבים ל:
ת"ד 724, הר אדר 90836