x

Einloggen

Hast du noch keinen Account? Jetzt registrieren!

Forscher geben bekannt: PCs können endlich große Datensätze analysieren

Forscher geben bekannt: PCs können endlich große Datensätze analysieren
Forscher geben bekannt: PCs können endlich große Datensätze analysieren 
Computerwissenschaftler der Carnegie Mellon Universität haben ein Gerüst erschaffen, mit dem man große Anwendungen wie zum Beispiel soziale Netzwerke oder Suchen im Web effizient auf einem nicht vernetzten PC betreiben kann. Die Software könnte Entwicklern bei der Arbeit bei vielen neuen Aufgaben helfen: zum Beispiel dabei, eine neue Maschine für Empfehlungen zu entwerfen, welche die Verbindungen aus sozialen Netzwerken nutzt. Um erfolgreiche Empfehlungen geben zu können  – „Ihre Freunde mochten diesen Film, deshalb haben wir jetzt einen weiteren Film, den Sie noch nicht gesehen haben, der Ihnen aber gefallen könnte“-  muss die Software die Verbindungen zwischen den Mitgliedern eines sozialen Netzwerks analysieren können. 
Diese Aufgabe heißt Diagrammberechnung und nimmt an Bedeutung zu. Aber die Arbeit an großen Datensätzen (wie sozialen Netwerken) erfordert normalerweise, dass der Prozessor die „Pferdestärken“ mehrerer vernetzter Computer besitzt, wie zum Beispiel der Cloud-gestützte Dienst von Amazon EC2.

Die neue Software namens GraphChi nutzt die bei PCs immer gängigeren umfangreichen Festplatten. Ein Diagramm würde für eine Analyse normalerweise im temporären Speicher (RAM) aufbewahrt werden. Mit GraphChi übernimmt das Laufwerk diese Aufgabe.
„PCs haben nicht genug RAM um eine ganze Berechnung im Web zu speichern, aber sie haben Laufwerke, die eine Menge Informationen speichern können“, erklärt Carlos Guestrin, der Koordinator des Forschungslabors von Carnegie Mellon, in dem GraphChi entwickelt wurde. Aber Laufwerke sind im Vergleich zur RAM langsam beim Lesen und Schreiben von Daten, da eben dieses die Berechnungen des Computers verlangsamt. Deshalb hat ein Student von Guestrin namens Aapo Kyrola eine schnellere und weniger vom Zufall abhängige Methode mit dem Laufwerk zu arbeiten ermittelt.

Laut Guestrin kann ein Mac Mini der auf dem GraphChi läuft, die Darstellung des social graph auf Twitter aus dem Jahre 2010 – was 40 Millionen Nutzer und 1,2 Billionen Verbindungen bedeutet – in nur 59 Minuten bewältigen. Guestrin erklärt: “Das letzte diesbezüglich veröffentlichte Forschungsergebnis ergab bei einer Menge von 1000 Computern eine Dauer von 400 Minuten“.  
Da die Technologie immer mehr vernetzt wird und die Datensätze immer größer werden, wird die Berechnung der Graphik in vielen Domains immer wichtiger, meint David A. Bader, ein Rechnerexperte bei Georgia Tech. Er meint: „Der Versuch zu erkennen, wie das menschliche Gehirn funktioniert oder den Inhalt medizinischer Patientenakten zu verstehen erfordert graphische Berechnungen am Computer“.

Bader sagt, GraphChi könne keine „im Fluss befindlichen Berechnungen“ bearbeiten, die nach dem Vorbild der großen Netzwerke genauer aufzeigen, wie sich die Beziehungen untereinander im Laufe der Zeit verändern. Bader und weitere Mitarbeiter von Georgia Tech haben die Rahmenbedingungen für ein computergestütztes Berechnungssystem namens Stinger geschaffen, das optimal für Supercomputer mit besonders veränderlichen Graphen geeignet ist.  
    
„Die Anzahl dieser Probleme nimmt anscheinend zu“, meint Guestrin, dessen Team schon daran arbeitet, GraphChi auch für veränderliche Graphen einsetzbar zu machen. Aber er sagt GraphChi sei schon in der Lage, viele groß angelegte computergestützte Berechnungen erfolgreich zu bearbeiten ohne auf Cloud-gestützte Lösungen oder Supercomputer zurückzugreifen.
Guestrin meint:“ Ein Forscher, der Berechnungen im Fach Biologie anstellt, könnte groß angelegte Berechnungen auf seinem PC anstellen; ein Entwickler, der an einem von einer  Datenbasis gestützten Algorythmus arbeitet, kann ihn auf seinem Laptop testen, bevor er ihn an die Cloud weiterreicht. Große Mengen an Daten sind heutzutage überall, aber eine große Datenmenge ist relativ betrachtet nicht mehr so groß wie früher. Hilfsmittel wie GraphChi werden in Zukunft viele Unternehmen und Startups befähigen, alle ihre Berechnungsprobleme mit einem einzigen Gerät zu lösen. Es ist kostensparend und trotzdem innovativ“.
1151 Mal gelesen
+1
29. Jul 2012, 06:00

Kommentare

(0)
RSS

Kommentieren

Fett Kursiv Unterstrichen Durchgestrichen   Link Zitieren Code
Ich bin mit den Nutzungsbedingungen einverstanden.
Zukünftige Kommentare zu diesem Beitrag abonnieren (abbestellbar).
 
Bitte klicke jetzt auf den Bestätigungslink in deiner E-Mail.