מהי מכונת Wayback ומדוע היא שימושית?
מרשתת אתרי אינטרנט גיבור / / April 22, 2021
עודכן לאחרונה ב
מכונת Wayback היא החלק הפופולרי ביותר של אתר ארכיון האינטרנט. הכלי המקוון החינמי שהוצג לראשונה בשנת 2001 מאפשר לך לחזור "אחורה בזמן" כדי לראות כיצד נראים אתרים ברחבי העולם בנקודות זמן. מכונת Wayback כוללת 562 מיליארד דפי אינטרנט בזמן כתיבת שורות אלה, כאשר רבים נוספים נוספים בכל שנה.
הנה מבט על מכונת Wayback ומה הופך אותה למיוחדת.
מבוא לארכיון באינטרנט
ארכיון האינטרנט, שנוצר על ידי ברוסטר קהל וברוס גיליאט, הוא ארגון ללא כוונת רווח עם מטרה מוצהרת של "גישה אוניברסאלית לכל ידע". מההתחלה, הארגון סיפק גישה ציבורית בחינם לחומרים דיגיטציה, כגון דפי אינטרנט, ספרים, הקלטות שמע, כולל קונצרטים חיים, קטעי וידאו, תמונות ותוכנות תוכניות.
נכון להיום, כל מה שנאסף בארכיון האינטרנט תופס יותר מ -70 פטאביטים של שטח שרתים, כולל שני עותקים של הכל. הארגון ממומן באמצעות תרומות, מענקים ושכר טרחה משירותי דיגיטציה של ספרים. לפרטיות, ארכיון האינטרנט אינו עוקב אחר כתובות ה- IP של קוראיו ומשתמש בפרוטוקול HTTPS (מאובטח) לאורך כל הדרך.
מכונת Wayback
רק חלק אחד מארכיון האינטרנט, מכונת Wayback, תוכנן ללכידת תוכן אתר ששונה או הוסר. מאז ההשקה הוא הפך לאחד המקומות הפופולאריים והמוכרים ברשת. קאהל וגיליאט קראו לאתר על שם המכשיר הבדיוני לנסוע בזמן בסדרת האנימציה של שנות ה -60, The Rocky and Bullwinkle Show.
למרות שארכיון האינטרנט לא השיק את האתר לציבור עד אוקטובר 2001, מכונת Wayback החלה בארכיון דפי אינטרנט במטמון החל ממאי 1996. עד שנת 2001 הקלטות הדיגיטליות אחסנו מידע שהיה נגיש רק למדענים ולחוקרים נבחרים. כשהכל עלה לאוויר הציבור חמש שנים מאוחר יותר (כפי שתוכנן זמן רב), הוא כבר הכיל למעלה מ -10 מיליארד עמודים בארכיון.
אחסון ואוספים
כיום, האתר שומר נתוני רשת היסטוריים באשכול צמתים של לינוקס. מכונת Wayback מורידה את כל המידע וקבצי הנתונים הנגישים לציבור בדפי אינטרנט באמצעות מנגנון הסריקה שלה. עם זאת, לא כל מה שמתפרסם באתר כלול כאן מכיוון שתוכן כלשהו מוגבל או מאוחסן בבסיסי נתונים, שאינם נגישים. מסיבה זו, יש אתרי אינטרנט שנסרקים טוב יותר מאחרים, תלוי באופן שבו מפתחים יצרו אתר בכל פעם.
כמו כן, תוכל להבחין ככל שהארכיון חדש יותר, כך יש יותר תוכן זמין לכל אתר נתון. כלי חדש שארכיון האינטרנט הציג בשנת 2005 הוא אחת הסיבות לכך שהנתונים החדשים יותר מלאים. Archive-It.org מסייע להתגבר על חוסר עקביות באתרים השמורים באופן חלקי בכך שהוא מאפשר למוסדות וליוצרי תוכן לקצור ולשמר אוספים של תוכן דיגיטלי.
על זחילה
סורקי אינטרנט, המכונים לפעמים עכביש או עכביש, הם ותיקים כמו האינטרנט עצמו. סורקים אלה הם בוטים באינטרנט הגולשים ברציפות באינטרנט למטרות אינדקס, מה שהופך אותם למרכיב חשוב בכל מנוע חיפוש מודרני. הסורקים המשמשים את מכונת Wayback ליצירת תמונות דיגיטליות של אתרים מגיעים ממקורות שונים, שהשתנו עם הזמן.
כפי שתבחין במהירות, תדירות הצילומים המשתנים משתנה מאוד לפי האתר. בדרך כלל, ככל שאתר גדול יותר (ואולי פופולרי יותר), כך מתרחש יותר סריקה. בנוסף, הרבה תלוי בתדירות שבאתר יש שינויים בדפים. אפילו האתרים הקטנים ביותר נסרקים בסופו של דבר אלא אם כן יש סיבה שהם לא. לדוגמה, אתרים המוגנים באמצעות סיסמה אינם נסרקים, וגם אתרים שבעלי האתרים ביקשו שלא להיכלל בהם.
שימוש במכונת Wayback
אתר מכונת Wayback קל לשימוש לכל אחד. כדי למצוא תצלומים היסטוריים של אתר, הקלד את שמו במנוע החיפוש של האתר. בדף תוצאות החיפוש היפר-קישורים מציינים תאריכים ושעות שבהם האתר הועבר לארכיון. לחץ על הקישור כדי לראות את האתר "אחורה בזמן".
בדוגמאות הבאות תוכלו לראות את העמוד הראשון של אתר אפל שהוקלט בפברואר 2005 ונובמבר 2014, ואת דף הבית של CNN מתאריך במרץ 2004 ובספטמבר 2010.
הערה: סריקות אלה כוללות קישורים לדפים אחרים כפי שהם נרשמו בתאריכים הנתונים, ולא רק לדפי הבית.
כלים מתקדמים
מכונת Wayback, שנוצרה עבור חוקרים והציבור כאחד, כוללת כמה כלים מובנים שמשתמשים מזדמנים עלולים לפספס. לדוגמא, לפי עיצוב, דפי תוצאות החיפוש קלים להפניה. כפי שהוסבר, "אם אתה מוצא דף מאוחסן שאליו תרצה להפנות בדף האינטרנט שלך או במאמר, תוכל להעתיק את כתובת האתר. אתה יכול אפילו להשתמש בהתאמה מטושטשת של כתובות אתרים ומפרט תאריכים... אבל זה קצת יותר מתקדם. "
מכונת Wayback מאפשרת גם לבעלי אתרים להשתמש בתכונה "שמור עמוד עכשיו" כדי לשמור דף ספציפי. ועדיין, זה לא מושלם. נכון לעכשיו, התכונה לא מוסיפה את כתובת האתר לסריקות עתידיות כלשהן. בנוסף, הבקשה לא שומרת יותר מדף אחד. עם זאת, זהו צעד ראשון טוב לארכיב את דף הבית של האתר שלך לצורך הרשומה ההיסטורית.
אינך צריך לבקר במכונת Wayback בכל פעם כדי לבצע חיפוש חדש. במקום זאת, תוכל למצוא תוכן על ידי הקלדת הכתובת בסרגל הכלים של דפדפן האינטרנט שלך. השתמש בפורמט זה לכל החיפושים: http://web.archive.org/*/www.yoursite.com/*. לדוגמא, השתמש http://web.archive.org/*/www.groovypost.com/* למצוא דפים מאוחסנים ל- GroovyPost!
כלים למפתחים ולמפתחים
לבסוף, מכונת Wayback אינה ממוקמת רק דרך האינטרנט. אתה יכול למצוא אפליקציית Wayback Machine עבור iOS ו דְמוּי אָדָם. יש גם הרחבות עבור Chrome, Safari ו- Firefox. מפתחים ירצו לבדוק גם את ממשקי ה- API של מכונת Wayback Machine לאינטרנט. אלה מקלים על מפתחים לאחזר מידע על נתוני לכידת Wayback.
מכונת Wayback לארכיון האינטרנט תומכת בכמה ממשקי API שונים. בכך, זה מקל על מפתחים לאחזר מידע על נתוני לכידת Wayback.
חזרה "אחורה בזמן" לאתרים המועדפים עליך היא הסיבה מספר 1 לבקר במכונת Wayback. זה גם כלי נהדר לכל מי שחוקר היסטוריה של אתרים לפרויקטים בבית ספר או לשימוש עסקי. לא משנה מה שתעשה, בקר במכונת Wayback ובדוק מה תוכל לגלות בכמה צעדים פשוטים.
למידע נוסף על שירות המנויים Archive-It של ארכיון האינטרנט, בקרו באתר אתר רשמי והתחל לתרום עוד היום!