תחי ישראל - אין לנו ארץ אחרת

תחי ישראל -אין לנו ארץ אחרת

נסיעת מבחן למערכת בינה מלאכותית לשכתוב תוכן של AI21 labs

מחבר:
בתאריך:

אחד התסכולים הגדולים של מלאכת הכתיבה הוא שיכתוב התוכן, לכן טוב שישנם היום כלים שיכולים לעזור. חברת AI21 Labs שחררה גרסת בטא של rewrite - כלי מבוסס בינה מלאכותית המסייע בשכתוב משפטים. כרגע, הכלי זמין לקבוצה נבחרת של משתמשים. לקחתי אותו לנסיעת מבחן.

rewrite by a121 labs

חברת ההזנק AI21 Labs שהקימו אמנון שעשוע, יואב שוהם ואורי גושן פועלת מישראל ואחראית ליצירת Jurassic - אחד המודלים המתקדמים והגדולים בעולם בתחום הבנת שפת אנוש הגובר בהיבטים מסוימים על GPT-3 המפורסם ממנו, ועדיין מוצע בחינם באתר החברה. בשנה שעברה הציגה AI21 Labs את המודל HAIMKE המנסה להפוך רשימת נקודות למאמר. השנה הם משחררים באופן מוגבל את rewrite כלי בינה מלאכותית לשכתוב משפטים באנגלית.

בחנתי את יכולת השכתוב של מודל rewrite על טקסטים קצרים באנגלית (הקלט מוגבל ל-288 תווים).

הזנתי את המשפט:

"The ball was hit by the boy."

וקיבלתי חזרה:

The boy hit the ball.
A boy hit the ball.
It was hit by the boy.
He hit the ball.
Boy hits ball.
This boy hit a ball.
Boy hit the ball.
Stupid boy hit the ball.

8 הצעות שמתוכם אני יכול לבחור את הניסוח המתאים לי ביותר.

2 האפשרויות הראשונות הם מה שציפיתי:

The boy hit the ball.
A boy hit the ball.

כי עדיף להימנע משימוש בסביל.

המודל גם הציע את השכתוב הבא:

Boy hits ball.

בעל תחביר לקוי. אז עם כל הכבוד לבינה המלאכותית עדיין נדרשת תשומת לב מצידה של בינה אנושית.

אפשרות אחרת אותה הציע המודל:

Stupid boy hit the ball.

למרות שלא ציינתי דבר במשפט אודות הילד, המערכת מצאה לנכון לכנות אותו בכינויים. כנראה בגלל הסתברות גבוהה לסמיכות בין המילים בנתונים ששימשו לאימון.

נראה דוגמה נוספת:

"It was clear to us that a mixture of vitamins and minerals is not illegal."

שני נוסחים אותם הציעה המערכת מצאו חן בעיניי. הראשון:

We were convinced that a mixture of vitamins and minerals is legal.

בו הפכה השלילה הכפולה not illegal לתיאור legal, תוך מניעת הבעיה הסגנונית של שלילה כפולה double negation.

הניסוח השני זורק לכיוון אחר בלי לאבד את הכוונה המקורית של המשפט:

A mixture of vitamins and minerals is not against the law

ניתן לשנות את מזג הכתיבה על ידי שינוי פרמטר. עד עכשיו השתמשתי באפשרות general המהווה ברירת מחדל אבל קיימות אפשרויות אחרות: formal, casual, long או short. בחנתי את האפשרות short על האמירה הבאה:

"In my opinion, it is important to be concise while writing."

שתיים מהאפשרוית שקיבלתי חזרה התעלמו מהפסוקית in my opinion:

Being concise while writing is important.
Conciseness is important while writing.

בצדק כי אדם כותב מביע בדרך כלל את דעתו כך שאין צורך לציין את המובן מאליו.

כשניסיתי את המשפט:

"Ben-Gurion made the decision to establish the state of Israel."

המודל הציע בין היתר:

Founded by David Ben-Gurion, Israel is the nation state of the Jewish people.
In 1948, Ben-Gurion declared that Israel would be a nation state.

במשפט שהזנתי אין דבר על שנת הקמת המדינה או היותה בית לאומי ליהודים. בכל זאת, הבינה השחילה ידע כללי לתוך המשפט המשוכתב מה שרומז שהיא מבוססת על מודלים של שפה דוגמת Jurassic, הלומדים מקורפוס גדול של מקורות מידע.

מעניין איך המערכת תתמודד עם חזרות מיותרות:

"A furniture store sells high-cost upholstered sofas and low-cost upholstered sofas."

אחת התוצאות:

The store sells cheap and expensive upholstered sofas.

פוגעת בול בפוני!

מה לגבי משפט מפותל וסתום מעין זה:

"If convenience is what we are interested in selling we need to provide an image or phrase that distracts the customers from the price while focusing their attention on it."

בין האפשרויות שקיבלתי מצאתי כאלה שהצליחו לעשות הקבלה בין it בסופו של המשפט לבין convenience במיקום השני. לדוגמה:

If we are selling convenience, then we should use an image or phrase that distracts the customer from the price while focusing their attention on the convenience.

כפיים! הטרנספורמר, ליבו של המודל, הצליח לשייך את it להקשרו הנכון.

בשלב זה חייבים לדבר על הפיל בחדר כי עם קצב ההתקדמות של מערכות הבינה המלאכותית, בפרט מערכות מבוססות טרנספורמר, ישנם אנשים החוששים לפרנסתם. זה דומה לחששות שהובילו פועלי טקסטיל לחבל במכונות במאה ה-19 כיוון שמכונה אחת יכלה לעשות בקלות עבודה של עשרות פועלים. אבל אם יש משהו שניסיון החיים לצד טכנולוגיה לימד אותנו הוא כמה אנחנו נהנים ממנה. עובדים פחות, וחיים יותר.

לסיכום, Rewrite הוא מודל בינה מלאכותית טוב מאוד היכול לסייע לכותבי האנגלית להשחיז את הכתיבה שלהם ולהימנע מבעיות סגנון ותחביר, בדומה ל- Grammarly האמריקאית, והצעות העריכה של Google Docs. הייתי שמח למערכת דומה שתעבוד בשבילנו, כותבי העברית.

 

גם זה יעניין אותך

הטרנספורמרים משנים את עולם הבינה המלאכותית

הקמת אפליקציה אינטרנטית למערכת שאלות ותשובות מבוססת בינה מלאכותית

היכונו לעידן המכונות החושבות, למידת מכונה בדפדפן באמצעות ספריית TensorFlow.js

 

לכל המדריכים בנושא של למידת מכונה

 

אהבתם? לא אהבתם? דרגו!

0 הצבעות, ממוצע 0 מתוך 5 כוכבים

 

 

המדריכים באתר עוסקים בנושאי תכנות ופיתוח אישי. הקוד שמוצג משמש להדגמה ולצרכי לימוד. התוכן והקוד המוצגים באתר נבדקו בקפידה ונמצאו תקינים. אבל ייתכן ששימוש במערכות שונות, דוגמת דפדפן או מערכת הפעלה שונה ולאור השינויים הטכנולוגיים התכופים בעולם שבו אנו חיים יגרום לתוצאות שונות מהמצופה. בכל מקרה, אין בעל האתר נושא באחריות לכל שיבוש או שימוש לא אחראי בתכנים הלימודיים באתר.

למרות האמור לעיל, ומתוך רצון טוב, אם נתקלת בקשיים ביישום הקוד באתר מפאת מה שנראה לך כשגיאה או כחוסר עקביות נא להשאיר תגובה עם פירוט הבעיה באזור התגובות בתחתית המדריכים. זה יכול לעזור למשתמשים אחרים שנתקלו באותה בעיה ואם אני רואה שהבעיה עקרונית אני עשוי לערוך התאמה במדריך או להסיר אותו כדי להימנע מהטעיית הציבור.

שימו לב! הסקריפטים במדריכים מיועדים למטרות לימוד בלבד. כשאתם עובדים על הפרויקטים שלכם אתם צריכים להשתמש בספריות וסביבות פיתוח מוכחות, מהירות ובטוחות.

המשתמש באתר צריך להיות מודע לכך שאם וכאשר הוא מפתח קוד בשביל פרויקט הוא חייב לשים לב ולהשתמש בסביבת הפיתוח המתאימה ביותר, הבטוחה ביותר, היעילה ביותר וכמובן שהוא צריך לבדוק את הקוד בהיבטים של יעילות ואבטחה. מי אמר שלהיות מפתח זו עבודה קלה ?

השימוש שלך באתר מהווה ראייה להסכמתך עם הכללים והתקנות שנוסחו בהסכם תנאי השימוש.

הוסף תגובה חדשה

 

 

ענה על השאלה הפשוטה הבאה כתנאי להוספת תגובה:

איך קוראים בעברית לצ`ופצ`יק של הקומקום?