מילון עברי-אנגלי

מטרת פרויקט המילון של קולמוס היא לספק למשתמש דובר העברית מילונים חופשיים על בסיס המאגרים הקיימים ברשת ומחוץ לה.

בשלב זה הפרויקט מתמקד במילון עברי-אנגלי.

העדכון האחרון: 12 בינואר 2013. להורדה

העדכון כולל:
  1. מילון עברי-אנגלי מבוסס על ויקימילון. תאריך בסיס הנתונים: 10 בינואר 2013
  2. מילון עברי-אנגלי מבוסס על לקסיקון של מיל"ה גרסה 2.0. תאריך בסיס הנתונים: 11 ביוני 2007
  3. מילון עברי-אנגלי של אברהם שלמה ולדשטיין. תאריך העדכון: 11 בינואר 2013

כיצד מתקינים?

ההוראות להלן מתייחסות לאובונטו, אבל הרעיון העקרוני תקף לכל ההפצות של לינוקס.
  1. מתקינים את חבילת dictd שמהווה התשתית של המילונים למיניהם. זהו למעשה שרת שיספק את ההגדרות המילוניות לתוכנת לקוח שתותקן בשלב הבא.
  2. מתקינים את תוכנת הלקוח לפי טעמכם. משתמשי KDE יכולים להתקין את dikt או את kdict, שתיהן תוכנות קטנות וחביבות למדי.
  3. מורידים ופורסים את חבילת המילונים העבריים מאתר זה.
  4. נכנסים לחשבון משתמש root.
  5. מעתיקים את הקבצים עם הסיומות dict.dz ו-index לתיקיה /usr/share/dictd/.
  6. מריצים את הפקודה dictdconfig -w כדי לעדכן את קבצי ההגדרות של dictd במילונים החדשים.
  7. מאתחלים מחדש את dictd באמצעות הפקודה /etc/init.d/dictd restart
  8. פותחים את תוכנת הלקוח ונכנסים להגדרות. ב-kdict ניתן לעשות זאת ע"י בחירה של "Settings->Configure Dictionary..." ובחירה בסעיף Server.
  9. מגדירים Hostname: localhost, ומשאירים את הפורט כמו שהוא (אמור להיות 2628).
  10. כעת המילון מוכן לשימוש.

רשיון

איך זה עובד

הרעיון הוא די פשוט. לוקחים קובץ מידע של ויקימילון, למשל, והופכים אותו בשלושה צעדים לפורמט DICT שהוא הפורמט הנפוץ למילונים בלינוקס, וישנו מספר רב של תוכנות התומכות בו. בשלב ראשון סקריפט של Perl מנתח את הויקימילון, זורק מידע שאין לו שימוש כרגע, ואת המידע השימושי, כגון ערכים ותרגום שלהם, פולט לקובץ XML בפורמט פשוט שאני המצאתי לצורך זה. בשלב שני עוד סקריפט של Perl לוקח את קובץ ה-XML הפשוט וממיר את המידע שבו לפורמט FOLDOC. את ה-FOLDOC הופכים ל-DICT עם פקודה סטנדרטית. ניתן להבין את התהליך ביתר פירוט כשמעיינים בקבצי סקריפטים ובקובץ build.sh שבתוך חבילת קוד המקור.

סטטיסטיקה

גרסה מספר ערכים
ויקימילון לקסיקון מיל"ה מילון ולדשטיין
20080822 4055 - -
20080919 4055 5306 -
20081128 4055 5306 126
20090427 4523 5306 277
20090618 5427 5306 277
20110109 7906 5306 277
20110130 7963 5306 277
20120121 8285 5306 277
20120218 8341 5306 277
20120304 8358 5306 401
20120602 8410 5306 726
20120903 8441 5306 966
20130112 8487 5306 1282