כיצד לחזור על אותם תוצאות בדיוק כשמשתמשים ב-Keras לצורך למידת מכונה

מחבר:
בתאריך:

ודאי שמתם לב שכשאתם מאמנים את אותו המודל על אותם הנתונים אתם מקבלים תוצאות שונות. זה יכול להיות ערכים שונים של loss או תחזיות שונות.

העדר החזרתיות נובעת מהאופי האקראי של למידת המכונה. לדוגמה, המשקולות נקבעים באקראי ובהמשך מעודכנים בהיזון חוזר באמצעות Gradient Descent. או כשמשתמשים בשכבת Dropout שמסירה חלק מהנתונים באקראי.

השונות הזו מובנית במערכת אבל לפעמים אנחנו מעוניינים לקבל תוצאות עקביות אז במדריך זה נלמד כיצד לאלץ את Keras להנפיק את אותם התוצאות בכל פעם ובתנאי שמשתמשים באותו המודל ובאותם הנתונים.

כיצד לחזור על אותם תוצאות בדיוק כשמשתמשים ב-Keras לצורך למידת מכונה

הרעיון הוא לזרוע את זרע אקראי random seed שישמש את המערכת כשהיא יוצרת מספרים אקראיים שיהיו תמיד אותם מספרים כי הם באים מאותו זרע.

את הזרעים זורעים בנפרד עבור Pyton, Numpy ו-Tensorflow. כידוע Keras הוא ממשק של Tensorflow.

את הזרעים חשוב לזרוע בתחילת הקוד.

# import dependencies
import random as rn
import numpy as np
import tensorflow as tf

2 השורות הבאות חשובות לחזרתיות עבור פונקציות של פייתון אשר משתמשות בהאשים:

import os
os.environ['PYTHONHASHSEED'] = '0'

כדי ש-Python יספק לנו תמיד את אותם המספרים האקראיים:

rn.seed(42)
  • את הפרמטר אפשר לשנות מ-42 לכל מספר שלם

כדי לקבל בדיוק את אותם המספרים מ-Numpy:

np.random.seed(6)
  • את הפרמטר אפשר לשנות מ-6 לכל מספר שלם

כדי לקבל בדיוק את אותם מספרים אקראיים מ-TensorFlow:

tf.set_random_seed(13)

בנוסף, צריך לאלץ את tensorflow להשתמש ב-single thread כי multi thread מוסיף גם הוא לאקראיות.

from keras import backend as K
session_conf = tf.ConfigProto(intra_op_parallelism_threads=1, inter_op_parallelism_threads=1)
session = tf.Session(graph=tf.get_default_graph(), config=session_conf)
K.set_session(session)

לכל המדריכים בנושא של למידת מכונה

 

אהבתם? לא אהבתם? דרגו!

0 הצבעות, ממוצע 0 מתוך 5 כוכבים

 

 

הוסף תגובה חדשה

 

= 4 + 9