1 / 47

Google & Google-Labs

Google & Google-Labs. Adrian Schuster. Übersicht Google. Geschichtliches Arbeitsweise/Technik Funktionen Suchmaschine Google. com vs. Google. de Bilder, Newsgroups, Nachrichten, Katalog, Directory, Expertenrat, Toolbar, Compute. Übersicht Google Labs. Funktionen VoiceSearch Keys

dora-craig
Download Presentation

Google & Google-Labs

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Google & Google-Labs Adrian Schuster

  2. Übersicht Google • Geschichtliches • Arbeitsweise/Technik • Funktionen • Suchmaschine • Google.com vs. Google.de • Bilder, Newsgroups, Nachrichten, Katalog, Directory, Expertenrat, Toolbar, Compute

  3. Übersicht Google Labs • Funktionen • VoiceSearch • Keys • Glossary • Sets • Rund um Google • Google Weblog, Googlefight

  4. Geschichtliches • Googol ~ Google • 1000000000000000000000000000...0 • 10100 • Milton Sirotta (Neffe von Edward Kasner) • Gründerväter • Sergey Brin • Lawrence Page

  5. Geschichtliches • Suchmaschinenprojekt an der Stanford University • „BackRub“ mit Fähigkeit, die Links zur indizierten Seite zu erfassen. • Nutzung von gewöhnlicher Hardware • Suche nach Investoren

  6. Geschichtliches • 7. September 1998: Google Inc. Menlo Park, California • Garagenfirma • 10.000 Anfragen • 1999: Suchmaschine von AOL/Netscape mit 3 Mill. Anfragen • 2001: Aufkauf von Deja.com

  7. Geschichtliches • heute: • >500 Angestellte • >150 Millionen Anfragen • >54 Millionen Benutzer (50% non-US) • >3 Milliarden Webseiten • >800 Millionen usenet-Posts • >330 Millionen Bilder • 36 Länderdomains

  8. Geschichtliches • heute: • >100 Millionen Dollar jährlicher Umsatz • ca. 100% jährliches Wachstum

  9. Browserhäufigkeit Nutzersprachen Mai 2001 - Oktober 2002 Geschichtliches

  10. Technik • „The Anatomy of a Large-Scale Hypertextual Web Search Engine“ 1998 • „The PageRank Citation Ranking: Bringing Order to the Web“ 1998

  11. Technik • größter kommerzieller Linux-Cluster • >10.000 Maschinen • 5 verteilte Datacenter • Google Search Appliances • Linux-Server

  12. Funktionen • Suchmaschine • simpel • leichtgewichtig • beständig • einfach • AND-Verknüpfung • keine Wildcards

  13. Suchmaschine • Filetypen • 12 Haupttypen • Portable Document Format (pdf), PostScript (ps), Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku), * Lotus WordPro (lwp), MacWrite (mw), Excel (xls), PowerPoint (ppt), Word (doc), Works (wks, wps, wdb), Write (wri), Rich Text Format (rtf), Text (ans, txt) • [filetype:rtf] • ähnliche Seiten (GoogleScout)

  14. Suchmaschine • Übersetzungen • Englisch übersetzt in • Deutsch • Französisch • Spanisch • Portugiesich • Italienisch • Erkennung von 36 Sprachen • „I´m feeling lucky“

  15. Suchmaschine • erweitert • Syntax • [_-ausgeschlossen] • [_+eingeschlossen] • keine Wildcards (aber Paltzhalter * ) • keine Groß-/Kleinschreibung

  16. Suchmaschine • Syntax • ["genauer Wortlaut"] • OR oder | • [site:www.distributed.net] • [link:www.distributed.net] • [related:www.distributed.net] • [info:www.distributed.net] • [stocks: amd shr]

  17. Suchmaschine • Syntax • [allintitle:arthur dent] • [intitle:beeblebrox ] • [allinurl:online/public] • [inurl:public_html] • z. B. inurl:fu-berlin site:fu-berlin.de • cache:www.inf.fu-berlin.de/inst/ags.html • date: ?

  18. .com vs. .de • Filtermechanismus, der Suchergebnisse des deutschen Ablegers zensiert • auch Frankreich, Schweiz • keine offiziellen Informationen erhältlich • gleicher Datenbstand wie google.com • Filterung der URLs vor Anzeige der Suchergebnisse • Seiten im Cache vorhanden

  19. .com vs. .de • z.B. Stormfront.org • nicht sichtbar: • www2.stromfront.org • www3.stromfront.org • www4.stromfront.org • women.stromfront.org • sichtbar: • irc.stormfront.org:8000

  20. Bilder images.google.com • 390 Millionen Bilder

  21. Bilder images.google.com • Beurteilung/Indizierung • <ALT>-Tag • Bildbeschreibung • Seiteninhalt • Bildanalyse • Duplikatentfernung • alle Suchtags möglich

  22. Bilder images.google.com

  23. Bilder images.google.com • SafeSearch • Filterung von „pornography and explicit sexual content “

  24. Newsgroups groups.google.com • usenet

  25. Newsgroups groups.google.com • >35.000 Gruppen • >700 Millionen Postings • usenet-Start in 1979

  26. Newsgroups groups.google.com • Übersicht einer Newsgroup

  27. Newsgroups groups.google.com • ältestes Posting in Net.general From: sdcarl!rusty Mon May 11 09:00:58 1981 To: ucbvax^mark Subject: newsgroup fa, net, etc. Won't we need to change the .ngfile also? Also is ALL an acceptable newsgroup on the left side of the dot such that ALL.ALL will catch everything? Rusty is right (or is that "Rusty is Wright"?) - we have ALL in our .ngfile so I tend to forget this. ALL.ALL may or may not work, but ALL certainly does. Mark I plan to make the change on Tuesday unless something horrible happens.

  28. Newsgroups groups.google.com • archiviert von Henry Spencer (Department of Zoology Toronto) • 1981 - 1991 • 141 Bänder á 120 MB

  29. Nachrichten news.google.com

  30. Nachrichten news.google.com • 4000 Nachrichtenquellen • mehrmals tägliche Aktualisierung • Gruppierung nach Themen ausschließlich mittels Algorithmen • Artikel der letzten 30 Tage

  31. Directory directory.google.com

  32. Directory directory.google.com • Webinterface für Open Directory Project (dmoz.org) • >1,5 Millionen Einträge • Verknüpfung mit Webindex zur besseren Sortierung

  33. Kataloge catalogs.google.com

  34. Kataloge catalogs.google.com • 5400 Rubriken • mailorder-Kataloge verschiedenster Anbieter

  35. Kataloge catalogs.google.com • Ergebnisanzeige

  36. Expertenrat answers.google.com

  37. Expertenrat answers.google.com • 500 freiwillige Experten für verschiedenste Fachgebiete bzw. Informationssuche • 2 - 200$ Kosten für Expertenantwort entsprechend der selbst eingeschätzten Schwierigkeit • 0,50$ Gebühr für Google

  38. Toolbar toolbar.google.com • Button-Leiste zur Integration in Browser • nur Windows ab M$IE 5.x • Eingabefeld für Suche • PageRank-Anzeige • integrierte Update-Funktion • mit integriertem

  39. Compute toolbar.google.com/dc • Distributed Computing • Berechnung der dreidimensionalen Faltung von Proteinen mit bekannter Aminosäurenstruktur • ca. 20 MB pro Monat • unauffällig mit Toolbar installiert • zufällige Aktivierung durch Google-Server

  40. labs.google.com • „Spielwiese“ für Google-Entwickler • erste Stufe im Entwicklungsprozeß • keine direkte Unterstützung der Funktionen • möglicherweise zukünftige Bestandteile der Google Services

  41. Google Labs Technologien • VoiceSearch (labs.google.com/gvs.html) • Suchanfrage via Telefon • Spracherkennung und Darstellung des Ergebnisses auf spezieller Seite • Keyboard Shortcuts (labs.google.com/keys) • Navigation innerhalb der Suchergebnisse mittels Tastatur

  42. Glossary labs.google.com/glossary • Finden von Wörtern, Phrasen und Akronymen

  43. Glossary labs.google.com/glossary • z. B. Benzodiazepine

  44. Sets labs.google.com/sets • generierte Wortlisten anhand von eigenen Beispielen

  45. labs.google.com/sets

  46. Rund um Google • Google Weblog (google.blogspace.com) • Sammlung von Links bezüglich Google

  47. Rund um Google • Googlefight (www.googlefight.com) • Vergleich der Ergebnisanzahl zweier Suchbegriffe

More Related