an die Redaktion von boinc

ich möchte ihnen eine Vorschlag für ein internationales Projekt für Boinc machen.
eine Suchmaschine mir verteilten Datenspeichern und Crawlern, die in den Internetseiten und Archiven
nur die ganzen Sätze sucht und verarbeitet.
Das Ergebnis ist ein riesiges Satzarchiv in dem die User frei suchen können.
Also ein verteilter Massenspeicher mit vielen Aktivitäten : crawlen , indizieren,
vergleichen, parsen, intern suchen, privat oder allgemein speichern, ausgeben, übersetzen strukturieren, usw

Bild

      Communer       Satzsuche        
                       
    unter den   Sätzen        
                     
                       
  1.)   Kunst ist blaaaaaaa       Quelle link
                       
  2.)   Kunst hat wert       Quelle link
                       
  3.)   Kunst will alles verändern       Quelle link
                       
 
next Satz next

Fragen ?http://www.majdaj.de/communer1.htm

Der Unterschied zu "normalen" Suchmaschinen ist:
es werden nur Sätze gespeichert, keine ganzen Seite mit Layout, Bildern etc. die Sätze werden später in strukturierte Sätze umgewandelt.
die Sätze werden von den Usern gewertet
die User haben die Möglichkeit, eigen Sätze oder Veränderungen einzubringen, ohne ein eigene Seite zu haben
die Maschine ist unabhängig, opensource,
die Sätze sind frei die Einweg-suche wird erweitert durch eine weltweite echte Kommunikation mittels strukturierter Sätze

Def.::
Sätze sind sinnvolle Anreihungen von bekannten Wörtern
Sätze sollten eine Datenstruktur haben , etwas so: Satznummer, Satzart, Satz(text) max 500B, Quelle, Rankzahl, Link auf nächsten Satz.
Es braucht dann noch eine Liste: Suchwort zu Satznummer.

Vorteile
-für Boinc wären: weltweite Aktivität vor Tausenden von Computern
-für die User: gleichzeitige Nutzung als Satzsuchmaschine und persönlicher Satzspeicher
Spielmöglichkeiten for die User (neue Sätze eingeben oder verändern)
für die Forschung : alle Sätze überprüfen, vergleichen, strukturieren, übersetzen
für alle: ein grosser Wissensspeicher, von Menschen editiert und aktualisiert

notwendige Teile für die Realisierung dieses Projekts wären:
Crawler (sucht Sätze im Internet und in Archiven, texten.)
Indexer (jedes Wort des Satzes wird analysiert )
Satztrenner (nach Methoden von natural language parsing)
Massenspeicher verteilt auf User mit Redundanzen
Datentransfer an andere User
Suchfenster für User Ausgabefeld von drei besten Sätzen mit Link auf nächsten besten
Editiermöglichkeit für User
Archivrechner findet Logiken Unterschiede übersetzt
Fun-features : history der gesuchten und gefundenen Sätze ergibt Roman
Wettbewerb: wer findet oder editiert die besten oder meisten Sätze

die nächsten Schritte wären erstmal (auch mit anderen), zu überlegen, wie so eine Datensammlung und Verteilung zu organisieren ist spezielle Such-, crawl- und transfermethoden müssten erfunden werden, ich kann das nicht.

jetzt zu meiner Bitte um Zusammenarbeit: wäre es möglich, die Programmierung vollständig in ihren Händ zu geben, oder soll ich erst einige Programmteile liefern oder eine ausführliche Funktionsbeschreibung?
Vergleichbare lauffähige Software gibt es bei Yacy, ein OS -Projekt aber nur für ganze websites.
ich würde mich freuen, wenn sie auch anderen Boninc-Teams (übersetzt?) meine Idee vorlegen könnten und eine schönen Namen für das Projekt fänden, und dass alle meine Wünsche in Erfüllung gehen .

an Dankwart, ich schätze ihre Bemühungen um den organisierten Frohsinn. ich möchte, um die Ein- ausgabe zu testen, ihren Dankwart-bot mitbenutzen, wenns geht mit eigenem freien Speicher und mit eigener Ausgabe: 3 beste Sätze mit Bewertungsknopf + und minus (ohne "du" "bot") und etl. einen Satzeditor und und und ..

an Andere:: könnten sie auch ihre KollegInnen informieren und über eine Realisierung diskutieren und mir eine nicht zu harte Kritik zukommen lassen

ich hoffe auf eine freundliche Antwort und eine milde Kritik