ניסיון ראשון עם שרות גוגל איחסון

לפני זמן מה גוגל הודיעה על שרות חדש הנקרא Google Prediction API (גוגל חיזוי) אשר מאפשר "להאכיל" את הקופסאות השחורות של גוגל בסדרות גדולות של נתוני קלט ופלט ולאחר תהליך של אימון (training) ניתן לקבל חיזוי של הפלט על-פי קלט חדש. גוגל חושפים כאן שרות שהם משתמשים בו לדוגמה לצורך זיהוי אוטומטי של שפות בשרות התרגום שלה או בזיהוי דואר זבל בגימייל. בגדול משהו בסגנון של רשתות עיצביות למי שמכיר.

לאורך השנים עסקתי לא פעם בתחום המקצועי שלי בחיזוי: חיזוי צריכת מים, התנהגות רשתות מים, זיהוי זיהום ועוד.אפילו רק לצורכי מחקר הייתי רוצה להתנסות בשרות החיזוי החדש של גוגל. השלב הראשון בתהליך הוא הכנת סדרות הנתונים לצורך אימון מודל החיזוי והעלאתן לשרות האיחסון החדש של גוגל.

גוגל איחסוןGoogle Storage for Developers – הוא למעשה שרות איחסון בענן הדומה מאד לשרות האיחסון הותיק של אמאזון S3. ב- S3 אני משתמש כבר מספר שנים בעיקר לצורכי גיבוי אבל עשיתי בו שימוש גם לצורך הגשת קבצים סטטיים בבלוגלי. השרות של אמאזון טוב, יציב (לרוב) ויחסית זול. השרות של גוגל כרגע מתומחר מעט יותר גבוה אבל קבלתי שטח לנסיונות בנפח של 100GB כך שאני יכול להתפרע. יתרון מיידי שאני רואה לשרות של גוגל הוא התמיכה באובייקטים גדולים מאד. אם S3 מגביל את הגודל של כל קובץ ל- 5GB, לפחות על הנייר גוגל תומכת בגדלים של מאות גיגות. ההתעסקות בפיצול קבצים היא מתישה.

בניגוד לעשרות הכלים, תוספים לדפדפנים, ספריות קוד ועוד הקיימים עבור S3, לשרות החדש של גוגל כמעט ואין דבר. גוגל מספקים ממשק גרפי בסיסי ביותר (Google Storage Manager) וכלי חופשי להפעלה משורת הקוד לביצוע כל הפעולות(GSUtil).

יש לי כבר סקריפט המגבה כל יום את כל הקבצים בכל חשבונות האיחסון שברשותי לאיחסון של אמאזון. הדבר מתאפשר בעזרת ספריית ל- PHP בשם Amazon S3 PHP Class. הספרייה המקבילה לאיחסון של גוגל נמצאת עדיין בחיתולים ורק לפני זמן קצר התווספה האפשרות להעלות קבצים. מלפני יומיים, לאחר שינוי קל של הסקריפט הקיים, כל הקבצים של הבלוג הזה מגובים גם לשרות של גוגל.

אלעד בבלוגלי מגובה לאיחסון של גוגל

השלב הבא יהיה למצוא את הבעיה המתאימה לבדיקה בשרות החיזוי החדש, הכנת קבצי האימון והעלאתם לאיחסון של גוגל. יהיה מעניין.

רענון חשבונות POP3 בגימייל

רענון pop3

העובדה שניתן לקבל דואר חיצוני ב- POP3 לחשבון הגימייל זה לא חדש. אבל מסתבר שאני בפיגור של כארבעה חודשים שכן רק השבוע גיליתי שניתן לבצע רענון לחשבונות ה- POP3 מכפתור 'הרענון' בממשק של גימייל.

האפשרות עדיין לא הפכה לרשמית ונמצאת כרגע במעבדה. בכדי להפעיל אותה יש להיכנס לדפדפת ה- Labs תחת Settings ולהפעיל את Refresh POP accounts. שימו לב שבמידה ותבדקו את החשבון בתכיפות גבוהה תקבלו את ההודעה הבאה:

POP3 נבדק לפני זמן קצר מדי

גוגל משלמת 68% מהכנסות הפרסום באתרי שותפים

אתמול פרסמה גוגל לראשונה את אופן חלוקת ההכנסות מפרסום באתרי שותפים. על-פי הודעתה גוגל מעבירה לשותפים 68% מההכנסות של אדסנס לתוכן. באופן כללי, עבור מי שלא מכיר את השרות, אדסנס לתוכן הן מודעות הפרסום של גוגל המופיעות באתרים רבים שאינם של גוגל. קיים גם שרות של אדסנס לחיפוש בו מוצגות מודעות במנוע החיפוש של גוגל המוטמע באתרים חיצוניים. חלוקת ההכנסות של אדסנס לחיפוש היא 51% לשותפים.

השרות של אדסנס הושק בשנת 2003 ומאז היו רק ניחושים לגבי צורת חלוקת העוגה. באופן אישי אני הערכתי שהחלוקה היא פחות טובה מבחינת השותפים ושלא קיים שיוויון בינהם. חשבתי שאתר גדול כמו הארץ, שלמיטב זיכרוני פעם הציג מודעות אדסנס, בוודאי מקבל אחוז גדול יותר מההכנסות מאשר איזה בלוג קטן. זה כנראה נכון, שכן, במענה לשאלה ישירה בנושא, הובהר כי כולם מקבלים 68% למעט שותפים גדולים עימם יש לגוגל הסכם פרטי ומיוחד. השורה התחתונה עבור הבלוגר הקטן היא שהוא מקבל 68% מההכנסות. נראה לי סביר.

לא ברורה הסיבה מדוע גוגל פתאום החליטה לפרסם את הנתון הזה? בהודעתה כתוב רק שהדבר נעשה "in the spirit of greater transparency" – ברוח של שקיפות גדולה יותר… מעניין. מחיפוש (בגוגל כמובן) עולה שממש לאחרונה נערכה חקירה בנושא באיטליה וכנראה התקרבו למצב בו בית המשפט היה מחייב את גוגל לחשוף את המספרים. אמנם היו איזכורים מקוטעים לפרשה אבל היא לא זכתה לכותרות בארה"ב.

נקודה מעניינת נוספת היא ההבדל בחלוקת ההכנסות בין אדסנס לתוכן (68%) לבין אדסנס לחיפוש (51%).  האם המשמעות היא שכדאי יהיה לבעלי אתרים להציג תוצאות חיפוש ללא מודעות של אדסנס לחיפוש ולהצמיד להן מודעות של אדסנס לתוכן? האם 17% עושים את ההבדל? האם הביצועים יהיו שווים מבחינת אחוז ההקלקות? האם זה בכלל מותר?

הוליקראפ בגוגל מקומות

גוגל מקומות, או מקומות Google בשמו הרשמי, מאפשר לבעלי עסקים ליצור נוכחות על גבי שרות המפות של גוגל:

השתמש ב-'Google מקומות' כדי ליצור את הרישום שלך, ללא תשלום. כאשר לקוחות פוטנציאליים יחפשו מידע מקומי באתר המפות, הם ימצאו את בית העסק שלך: הכתובת, שעות הפתיחה ואפילו תמונות של חזית בית העסק או המוצרים. השירות קל, בחינם ואינך זקוק לאתר משלך.

אחד מהעסקים הראשונים שעשו שימוש בשרות היא חברת הוליקראפ – תיווך עיסקאות נדל"ן. החברה הממשלתית, בבעלות פרטית,תדאג לכל האישורים שאתם צריכים!
google-places-11.jpg

כרגע יש להמתין שנציג גוגל יתקשר לאימות הפרטים.

google-places-2.jpg

אילו שרותים של גוגל חסומים בסין?

המון כבר נכתב על נושא הפעילות (או אי-הפעילות) של גוגל בסין. לאחרונה ביטלה גוגל בסין את צינזור תוצאות החיפוש במנוע החיפוש שלה. במקביל הקימה החברה דף המראה באופן שוטף אילו שרותים סגורים בסין:

mainland-china-service-availability.PNG

נכון לאתמול שרותי החיפוש אינם חסומים.

מי צריך בלוג, יש באז

אני איש של דואר אלקטרוני. אין לי טוויטר, אני לא בפייסבוק, רק בדוא"ל. את כל כתובות המייל שלי אני מרכז תחת הממשק של גי'מייל וכל זמן שאני מול מחשב הוא פתוח. לפני יומיים גוגל דחפו לי לפנים את באז החדש שלהם. אם צריך היה להירשם או לבקש להתחבר לא הייתי שם אבל הבאז הופעל בסביבה הטבעית שלי בלחיצת כפתור. אז ניסיתי.

יש לי בלוג. הפעילות בבלוג די צנועה הן מבחינת הפוסטים והן מבחינת התגובות. אתמול כתבתי פוסט הקורא לא לתת זכות בחירה לישראלים בחול. הפוסט זכה לארבע תגובות בלבד בבלוג. מכיוון שכך בחרתי בהגדרות של גוגל באז, הפוסט פורסם גם בו. בבאז הפוסט קיבל 15 תגובות. למעשה הייתי יכול לפרסם את הפוסט רק בבאז, בשביל מה לעבור בכלל דרך הבלוג? הבאז מאפשר להכניס תמונות, סרטונים ובטח עוד דברים שטרם ראיתי. אם המטרה שלי היתה להעביר מסר בנושא עליו כתבתי אז הבאז הוא המקום הטוב יותר עבורי.

טל גלילי פרסם אתמול פוסט המסכם את הדיונים ברשת סביב באז וגם את דעת בנושא. גם הפוסט שלו פורסם במלואו בבאז וזכה שם ליותר תגובות מאשר הפוסט המקורי. בנוסף, טל שלח גם באז המודיע על הפוסט שכתב. גם לבאז הזה התקבלו יותר תגובות מאשר למקור. נראה לי שטל קצת נבהל שכן הוא רמז לאחד המגיבים שהתגובה בבאז יכולה להיות להיכנס כתגובה למקור. המגיב עשה העתק-הדבק.

אולי זו ההתלהבות הראשונית מהשרות אבל אולי הוא יהווה תחליף לחלק נוסף מהבלוגים. טרם שיניתי את ההגדרות אבל נראה לי שבקרוב אבטל את העידכון האוטומטי בטקסט מלא של הפוסטים בבאז אלא אפרסם שם רק את חלקם.

למה גוגל לא עדכנו את gears לשועל החדש?

Gears (איך לקרוא לדבר הזה בעברית?) הוא תוסף לדפדפן המאפשר, בין השאר,  לישומים אינטרנטיים לשמור מידע על הדיסק המקומי ובכך מתאפשרת הפעלה של היישומים באופן לא מקוון. את Gears מפתחת גוגל בקוד פתוח ועיקר השימוש שהיא עושה בתוסף הוא מתן גישה ליישומים שלה כאשר אתם לא מחוברים לרשת. הדוגמה הבולטת ביותר היא בגימייל, יישום הדואר אלקטרוני של גוגל, המאפשר שימוש במערכת גם ללא חיבור לרשת. בנוסף gears עובד גם ביישומים אחרים כגון גוגל דוקס ולוח השנה של גוגל. gears גם מוטמע במערכת הבלוגים וורדפרס.

אני משתמש בממשק של גימייל לניהול כל כתובת המייל שלי (יש הרבה) ומזה זמן רב אני משתמש ב- gears. לאחרונה יצאה גרסה חדשה לשועל האש , הדפדפן החביב עלי, אך אבוי! gears טרם עודכן והוא לא עובד על הגרסה החדשה (3.6). לא להתבלבל, גרסאות הבטא של של השועל יצאו כבר לפני מספר חודשים אך gears טרם עודכן. כמובן שיש דיווח על הבעיה אבל טרם מצאתי תגובה כלשהי של גוגל בנושא. יש כל מיני שמועות שגוגל זונחים את gears מסיבות שונות ובמידה וכך הם הדברים אז בסדר אבל תנו איזו הודעה.

תמיכה בכיווניות בטפסים של גוגל דוקס – זה היום של טל גלילי

טל גלילי, האיש שעושה הכי הרבה שאלונים בעזרת גוגל דוקס, ישמח לשמוע שגוגל הוסיפו תמיכה בכיווניות מימין לשמאל בטפסים. צריך להבין, זה האיש שביקש מהמוזמנים לחתונה שלו לענות על שאלון (באנגלית) – מזל טוב 🙂

bi-directional-language-support.png

טפסים ישנים יש לפתוח ולשמור בכדי שהתמיכה בכיווניות תעבוד.

כמה מילים בנושא הבקשה לתביעה ייצוגית כנגד גוגל

השבוע התפרסמו ידיעות על תביעה שהוגשה כנגד גוגל הכוללת בקשה להכרה בה כתביעה ייצוגית. במילים פשוטות נטען בתביעה, אשר הוגשה על-ידי יוני כהנא באמצעות עורכי הדין אורן אוזן ויוסי כפרי, כי גוגל חייבה חיובי יתר עבור שרות הפרסום שלה בתוכנית גוגל אדוורדס. בקצרה ניתן לתאר את תוכנית אדוורדס כתוכנית פרסום בה המפרסם משלם לגוגל עבור כל לחיצה (קליק) של המשתמשים על הפרסומת שלו.

יוני כהנא השתתף בתוכנית הפרסום של גוגל בכדי לפרסם את האתר העיסקי שלו בתחום אבטחת המידע. אגב, הדומיין של האתר המדובר, yhitech.com, מועמד בימים אלו למכירה (PR1 למי ששאל). יוני טוען כי ביצע מעקב באמצעות הלוגים של השרת בו אוחסן האתר שלו והסתבר לו כי הוא חוייב על-ידי גוגל על כמות קליקים הגדולה מסך הכניסות הכללית לאתר (הפרש של עשרות אחוזים). לאחר שפנה אל גוגל בנושא הוצע לו להתקין באתרו את שרות הסטטיסטיקה של גוגל, גוגל אנליטיקס, שכן "Google Analytics שואב את הנתונים לגבי הכניסות לאתר שלך דרך מודעות של Google AdWords מתוך בסיס הנתונים של Google AdWords".

מיד לאחר שהותקן השרות ערך יוני בדיקה נוספת ממנה עלה כי מספר הכניסות הנמדד על-ידי גוגל אנליטיקס "כמעט זהים" לאלו שהופקו מהלוגים של האתר. לעומת זאת, טוען יוני, חוייב על-ידי גוגל עבור מספר כניסות הגבוה ב- 80% מאלו שמדד האנליטיקס. מבדיקות נוספות שערך עלו הפרשים נוספים ולכן נטען כי "לא קיימת כל תאימות בין כמות הקליקים הנספרים על-ידי AdWords ואשר בגינם מחויב הלקוח לבין כמות הקליקים האמיתית, כפי שתוכנת Google Analytics מפיקה בדוחותיה".

לאחר פניה נוספת לגוגל נתקבלה התגובה כי אכן קיימות אי התאמות בין אדוורדס לאנליטיקס. לדוגמה מהסיבה הבאה:

Google AdWords עוקבת אחרי קליקים כאשר Google Analytics עוקבת אחר כניסות לאתר. במידה וגולש מקליק על המודעה פעמיים תוך 30 דקות מבלי לסגור את הדפדפן, Google Analytics תרשום את זה ככניסה אחת. Google AdWords תרשום 2 קליקים. אותו מצב יקרה כאשר גולש מקליק על המודעה, אחרי זה לוחץ על כפתור "חזור" ושוב לוחץ על המודעה Google AdWords תרשום 2 קליקים כאשר Google Analytics  תרשום כניסה אחת.

לטענת יוני, דוגמה זו סותרת את הפרסום של גוגל כי "כל שקל בתקציב שלך מושקע בהבאת לקוחות חדשים עבורך" (ההדגשה שלי). בהתאם לכך תובע יוני מגוגל סך של 260 ש"ח אשר לטענתו נגבו ממנו שלא בצדק. סכום זה מהווה 20.1% מסך החיוב.

ועכשיו למכפלות. נטען כי סך ההכנסות, בשנים האחרונות, מתוכנית אדוורדס, הסתכמה בסך של 493.5 מליון ש"ח. על-פי החשבון הפשוט נגבו ביתר, מציבור המפרסמים, כ- 104 מליון ש"ח אותם נתבעת גוגל להחזיר.

מדידת כניסות לאתרים (צפיות וביקורים בעיקר) הנה משימה בעייתית. ישנם כלי סטטיסטיקה רבים. בבלוג הזה מותקנים "רק" שלושה: גוגל אנליטיקס (הכלי המרכזי בו אנו משתמשים בבלוגלי), StatCounter ו- pMetrics. ישנו הבדל במדידה בין שלושת הכלים המגיע גם לסדר גודל של 20%. בהקשר הזה קצת מפליא אותי כי יוני ראה התאמה בין הלוגים של השרת למדידה של האנליטיקס. הראשון אמור לרשום כל פניה לשרת והשני בוודאי מסנן משהו.

צריך לשאול גם את השאלה מהי המטרה של הפרסום בגוגל או פרסום בכלל. האתר המדובר מכר שרותי בדיקות חדירה לאתרי אינטרנט ושרותים נוספים בתחום אבטחת המידע. גולש שהקליק על מודעה של האתר ולאחר מכן לחץ על הכפתור "חזור" למעשה עזב את האתר (כנראה ללא ביצוע קניה). על הפניה חוזרת לאתר, בעקבות לחיצה נוספת על המודעה, טוענת למעשה גוגל שיש לשלם. אפשר לראות את ההיגיון בכך למרות שאין מדובר ממש "בלקוח חדש" לגמרי כפי שטוען יוני.

הבעיה המרכזית שמציפה התביעה הזו היא העדר כלי סטטיסטיקה מדוייק עבור גוגל אדוורדס. כדוגמה נגדית אפשר להסתכל על חשבון הפלפון. אני יכול לקבל פרוט מלא ומדוייק של כל שיחה שערכתי. לאיזה מספר, זמן ומשך השיחה וכמובן המחיר. מבדיקה שעשיתי בעבר הצלחתי להבין בדיוק את חשבון הפלפון החודשי שלי. למיטב ידיעתי זה לא המצב בשרות גוגל אדוורדס. אני מעריך שלו היה כלי המאפשר הבנה מדוייקת של כל דולרהמושקע, אי הבנות מסוג זה היו מתבררות בקלות רבה יותר.

הערות:
1 – אינני עו"ד ואין לי כוונה לנתח ניתוח משפטי של המקרה.
2 – למען הגילוי הנאות, בעבר הרחוק השתמשתי בשרות גוגל אדוורדס וכיום אני משתמש בשרותים אחרים של גוגל.