מה ההבדל בין גרף ידע למסד נתונים גרפי?


תשובה 1:

"גרף ידע" ו- "מסד נתונים גרפי" הם שני מונחים מוכווני שיווק (ביטויי באז) הקשורים לייצוג נתונים מובנה (גרף הידע מחדש) ומערכות ניהול מסדי נתונים (מחדש מסד נתונים גרפי).

ההיבט "גרף" של ביטויי באזז זה עוסק במודל יחסי ישויות, אשר בדרך כלל מתואר כציור גרף (תרשים רשת או רשת).

ההיבט "ידע" של ביטויי באזז זה עוסק בסוג יחסי ישויות (יחסים) סמנטיקה שבאה לידי ביטוי במודל יחסי ישויות.

"גרף ידע" הוא בעצם אופי הנתונים המובנים (המאורגנים כמסמך מסד נתונים) המופעלים על ידי "מערכות ניהול מסדי נתונים גרפיים" תוך שימוש בשפות שאילתות הצהרתיות מגוונות (חלקן מבוססות על סטנדרטים פתוחים, למשל, SQL, SPARQL, בעוד אחרים הם קנייניים וספציפיים למוצרים, למשל, סייפר ואחרים).

מדוע יש לנו את ביטויי הבאז האלה?

ספקי מערכת ניהול מסדי נתונים יחסיים (RDBMS) למעשה עיצבו את המודל היחסי המקורי של אדגר קודד דרך מה שהפך ל- 12 של Codd (למעשה 13 פריטים עקב אינדקס מבוסס אפס).

למרבה הצער, המאמץ שלעיל הקדיש את האופי הגנרי של המודל המקורי המופשט של קודד לקודד למודל ספציפי ליישום בו היחסים מיוצגים באופן ספציפי ולא גנרי, כלומר N-Tuples (מתואר כטבלאות) כאשר כל אחד ממערכת היחסים מזוהה באופן ייחודי על ידי מפתח ראשוני - המנוגד למודל ההתייחסות הגנרי שפשוט דורש נתונים לביטוי כקשרים הכוללים Tuples.

Tuples יכולים ללבוש מגוון רחב של צורות הכוללות: N-Tuples (מה שרוב מוצרי RDBMS מציעים), 3-Tuples (מה מציעים תוארי RDF [R] מוצרי DBMS), 4-Tuples (מה תואם RDF [R] מוצרי DBMS התומכים ב- Graphed Nams מציעים) ואחרים ..

האפקט הנקי של כל אלה הביא לתת-ז'אנר DBMS חדש בשם Not-Only-SQL (NoSQL) שאליו שייכים "מסדי נתונים גרפיים".

מודל יחסי ישויות (מתואר כגרף)

תרשים הגדרת מסד נתונים יחסי (מתואר כטבלאות)

ז'אנרים של DBMS עם לוח

הופעתה של NoSQL הובילה באופן טבעי להרחבה של ז'אנרים של DBMS כפי שמתואר בטבלה שלהלן:

לחץ כאן לתצוגה מפורטת של טבלאות מתוקנות של ז'אנר DBMS.

דוגמאות לתרשים ידע?

בהתבסס על ניסיוני האישי בהשתתפות בפרוייקט, הנה כמה דוגמאות לתרשימי ידע הזמינים ונגישים באופן חופשי לכל אחד המצויד במכשיר מחשוב התומך בפרוטוקול HTTP, כלומר מכשיר המסוגל לחפש את הידע ולחקור את הידע בתגובה ל- פעולת הקלקה של המשתמש:

  • ענן נתונים פתוחים מקושר (שזרעה על ידי DBpedia) - זהו בסיס ידע מבוזר (או גרף הידע) הכולל נתונים מובנים הפרוסים באמצעות עקרונות נתונים מקושרים (כלומר, מודל יחסי ישות שבהם מזוהים ישות, תכונה וערך [אופציונלי] באמצעות היפר-קישורים [ כלומר URIs HTTP]).

כל צומת בענן שלעיל משויך לתחום ידע וניתן לבחינה מלאה על ידי אינטראקציות קליקים אנושיות ו / או בדיקות סוכן תוכנה באמצעות שאילתות SPARQL או SQL.

קשורים

  • מודל יחסי של נתונים עבור בנקים גדולים של נתונים משותפים - מאמר הזרע של אדגר קודד והמודל היחסי של יחסי ישות - לקראת מבט אחיד של נתונים - מאמר הזרע של פיטר צ'ן גרף תפיסתי לממשק בסיס נתונים - מאמר הזרע של ג'ון פ. סווה דאגות ומסקנות לגבי " ביטוי מסד נתונים גרפי "מהי DBpedia, ולמה זה חשוב? מה ענן הנתונים הפתוחים המקושרים ומדוע הוא חשוב? מה זה נתונים קטנים ומדוע חשוב? מילון מונחים

תשובה 2:

בסיס נתונים של גרפים הוא (לעיתים קרובות) קשת-על של גרף הידע.

גרף ידע: גרף ידע הוא בסיס ידע שהופך קריא למחשב בעזרת גרפים מקושרים והגיוניים, המהווים יחד קבוצה של עובדות קשורות זו בזו. גרף בהקשר זה יכול להיות, למשל, קבוצה מקושרת של שלשות RDF.

משולש RDF יחיד מייצג ידע אנושי בצורה סטנדרטית וקריאה במכונה על ידי קישור נושא, פועל ואובייקט (S-V-O) שידועים כקשורים זה לזה. שלשות אלה דומות למשפטים פשוטים של S-V-O בשפה אנושית שנעשו קריאות מכונה, כמו שאיאן מכיר את מרי.

דוגמא לשלושה RDF. מתוך "ממשק ה- API של RDF הליבה", תיעוד אפאצ'ה ג'נה, 2011-2019.

במקביל, ניתן להציג חזותית ייצוג RDF זה גם כצמתים (נושאים ואובייקטים) וקצוות (פעלים, או predicates) של גרפים.

כשחלק מגרף הידע הפונקציונלי, ה טריפל מסוג זה יכול להיות גם אמירה קריאה מכונה.

עובדות משולשות המקושרות באופן עקבי מבחינה הגיונית באמצעות גרף הידע הן בעלות כוח נימוק. כאשר עקבית לוגית מתווספים לשלושה עובדות לגרף, מכונות יכולות להסיק קישורים או חיבורים חדשים. חיבורים שהפכו לאנושיים לגלויים על ידי מכונות. מכונות יכולות לספק גישה לנתונים בשלשות המקושרות, גרפי הידע או העובדות המקושרות כחלק משירות מידע.

גוגל החלה להציע שירותי מידע מבוססי גרף בשנות העשרים של המאה הקודמת לאחר שרכשה את Freebase בשנת 2010. גוגל למעשה טבעה את המונח "גרף ידע", מונח שנפוץ לראשונה בשנת 2012.

נניח בדוגמה שלנו כי איאן מכיר את מרי מכיוון ששניהם רוכבים על קו האוטובוס 23 VTA (Valley Transportation Authority) בימי עבודה. ופעם הם לקחו את אותה האוטובוס לאותה תחנה, וגילו ששניהם עובדים באותו מקום.

אם ל- Google יש הרשאה לבצע את מעקב המיקום באמצעות הטלפון החכם של מרי ואיאן הן יכולות להסיק מפרטי מעקב המיקום כי כל אחת מהן עובדת באותו מקום.

מרי, למשל, יכולה ללמוד את מה שגוגל יודעת עליה על ידי מתן רשות לגוגל לבצע את המעקב ואז לצפות במה מפות Google עושה. מפות Google לאחר מעקב אחר מרי מיום ליום, מסיקה שהיא הולכת למיקום עבודה בימי עבודה ובשלב מסוים לאחר העבודה בדרך כלל חוזרת למיקום ביתי. גוגל תציג עובדות מסקירות אלה בסמארטפון של מרי כאשר היא משתמשת במפות Google.

בגלל שיקולי פרטיות והחלטות עיצוב, גוגל לא מציגה בפני מרי שאיאן עובדת באותו מקום שמרי עובדת. אך ישנם יישומי רשת חברתית אשר בהינתן הרשאות מתאימות מספקים תובנות מסוג זה.

מסד נתונים של גרפים: לרוב משתמשים במאגרי נתונים של גרפים לאחסון נתוני גרפי ידע. לפי ויקיפדיה,

  • "מסד נתונים הוא אוסף נתונים מסודר, המאוחסן בדרך כלל וגישה אלקטרונית ממערכת מחשב." "מאגר נתונים של גרפים הוא סוג של מסד נתונים של NoSQL המשתמש במבני גרפים עם צמתים, קצוות ותכונות לייצוג ואחסון של מידע. מאגרי נתונים גרפיים כלליים שיכולים לאחסן כל גרף נבדלים ממאגרי נתונים גרפיים מתמחים כמו שלשות גרפיות ומסדי נתונים ברשת. "

מערכת ניהול בסיסי נתונים: לפי ויקיפדיה,

  • "באופן רשמי, 'מסד נתונים' מתייחס לקבוצה של נתונים קשורים ולאופן התארגנותם. הגישה לנתונים אלה בדרך כלל ניתנת על ידי 'מערכת ניהול מסד נתונים' (DBMS) המורכבת ממערכת משולבת של תוכנת מחשב המאפשרת למשתמשים לקיים אינטראקציה עם מסד נתונים אחד או יותר ומספקת גישה לכל הנתונים הכלולים בבסיס הנתונים (אם כי הגבלות עשוי להתקיים המגבילים גישה לנתונים מסוימים). DBMS מספק פונקציות שונות המאפשרות כניסה, אחסון ושליפה של כמויות גדולות של מידע ומספק דרכים לנהל את אופן ההתארגנות של מידע זה. "בגלל הקשר ההדוק ביניהם, המונח 'מסד נתונים' משמש לעתים קרובות כלאחר יד כדי להתייחס לשניהם מסד נתונים ו- DBMS ששימשו לתפעולו. "

מתוך בסיס נתונים - ויקיפדיה, 2019

מנועי DB עקבו אחר 32 DBMS של גרפים שונים החל מיוני 2019. בין 12 המובילים באותה נקודה היו גרפי DBMS של נכסים כמו Neo4j ו- Arango DB ו- RDF חנויות מרובעות כמו Allegrograph, Virtuoso ו- Stardog. ראה דירוג מנועי DB עבור הדירוג הנוכחי.

בשנת 2019, World Wide Web Consortium (W3C) החל בתהליך של סטנדרטיזציה של נתוני גרפים, מאמץ להפגיש ולאפשר המרה סטנדרטית של נתוני תרשים מצורה אחת לאחרת, נתונים המיוצגים בדרכים שונות, כמו בתרשימי רכוש, RDF, או בצורה יחסית. ראו סדנת W3C בנושא סטנדרטיזציה באינטרנט לנתוני גרפים

ארגונים מסוימים בנו גרפי ידע בטכנולוגיית מסדי נתונים יחסית, וכל גרף ניתן לייצג בצורה של DB יחסי. אך מסדי נתונים של גרפים הפכו פופולריים בגלל הסטטוס הגבוה יותר שהם קיבלו לנתוני מערכות יחסים (כלומר, הפעלים במשפטים). באופן אירוני, נתוני מערכות יחסים נקברו לעתים קרובות במאגרי מידע יחסיים או חסרים אותם. היכן ההיגיון והשפה האנושיים היו אם הפעלים היו חסרים במשפטים שלנו?

נתוני מערכות יחסים חשובים באופן קריטי לשילוב ולשיתוף פעולה רחב היקף הטמונים במחשוב הקשר, וליצור וניהול של הקשרים אלה בדרכים גמישות וניתנות להרחבה על ידי פירוק מערכות יחסים מפורשות הפך להיות חיוני לשילוב בקנה מידה גדול ולתכנון הנדרש לצורך חיפוש כללי מלאכותי. אינטליגנציה.

עיין בתיאור של ג'ון לאונסבורי של שלושת השלבים של AI לפרטים נוספים על מחשוב קונטקסטואלי והשלב ההקשרי של AI.

יותר ויותר חברות יוצרות גרפי ידע כאמצעי להרחבה במאמצי ה- AI שלהם. ראה למשל את דוגמת המסחר האלקטרוני בסיבה מדוע גרפי הידע הם יסודיים לבינה מלאכותית, למשל.

תודה על ה- A2A, טרי גילברט.