Youtube - wie wird der Musiktitel im Video erkannt?

vom 22.07.2010, 00:03 Uhr

Wir hatten ein Video bei youtube eingestellt, in welchem ein deutscher Schlager abgespielt wurde. Nach kurzer Zeit gab es beim Aufruf des Videos die entsprechende iTunes-Werbung zum Downloaden des Liedes. (Später wurde das Video sogar gesperrt mit dem Hinweis, dass es in diesem Land nicht mehr verfügbar ist.)

Wie wird so ein Lied erkannt? Gibt es Software, die das automatisiert schafft, oder sitzen da Menschen, die sich das Video ansehen und dann die entsprechende Werbung schalten?

» nyxophyl » Beiträge: 3 » Talkpoints: 1,96 »



Ich bin mir ziemlich sicher, dass das tatsächlich noch 'von Hand' gemacht wird. Wenn ich mir anschaue, wie unzuverlässig selbst die teuerste Spracherkennungssoftware noch ist, kann ich mir kaum vorstellen, dass es eine verlässliche Lösung gibt, um Lieder in Videos zu identifizieren.

Zum einen gibt es nicht nur eine Unmenge an Titeln, die theoretisch auftauchen könnten, sondern auch ganz unterschiedliche Grade der Tonqualität. Da dürfte es technisch recht schwierig - wenn auch nicht unmöglich - sein, ein entsprechendes Programm zu schreiben, das brauchbare Erkennungsraten liefert. Ich schätze, dass das so teuer wäre, dass es sich einfach nicht lohnt. Es müssten ja dann auch immer noch Menschen angestellt werden, die die Videos auf z.B. rechtsextreme Inhalte hin prüfen.

Zum anderen lässt mich die riesige Zahl an Videos, die teils äußerst populäre Stücke ohne das entsprechende Copyright verwenden, daran zweifeln, dass da etwas anderes als Menschen am Werk sind. Es werden zwar durchaus regelmäßig Videos deswegen entfernt, aber es gibt doch trotzdem noch eine ziemlich große Menge von Clips, in denen die Tonqualität und der Bekanntheitsgrad der Songs zumindest die Vermutung nahelegt, dass eine Software leichtes Spiel damit habe dürfte, diese zu entdecken.

» ka mau » Beiträge: 203 » Talkpoints: 13,21 » Auszeichnung für 100 Beiträge


ka mau hat geschrieben:Ich bin mir ziemlich sicher, dass das tatsächlich noch 'von Hand' gemacht wird.

Von wem denn :D - bei Youtube werden pro Minuten über 8 Stunden an Material hochgeladen, das schafft beim besten Willen keiner, das alles zu sichten. Vor allem da eben nur eine geringe Zahl von Videos auch bereits in Textform dokumentieren, welche Lieder darin verwendet werden. Und dann soll da einer sitzen, der sich das Video ansieht und auch noch alle Musikstücke dieser Welt im Kopf hat um genau zu sagen: "Das ist Titel A von Künstler B vom Album C aus dem Jahr D!?".

Ich hoffe Du glaubst nicht auch noch, dass die Werbung das jeweils verwendete Lied als mp3 zu kaufen auch in Echtzeit von einem Menschen eingepflegt wird (wäre ja die logische Schlussfolgerung). Das ist alles Unsinn, sorry.

Der Rest deines Beitrages ist deswegen leider genauso am Thema vorbei, denn hier wird nicht mit einer Spracherkennung gearbeitet - das ist etwas völlig anderes!

Es gibt genug kostenlose Apps, die das können was auch YouTube einerseits verwendet um geschütztes Material zu identifizieren (sprich: als auch um dazu passend Werbung einzublenden. Und auch unter denkbar schlechten Voraussetzungen (starke Störgeräusche) funktionieren die noch tadellos - jeder der ein Smartphone (iPhone, Android Phone) hat kennt und nutzt Shazaam (kostenlos!), und etwas anderes als nutzt YouTube auch nicht. Und wer Shazaam schon einmal benutzt hat, weiß auch, dass es selbst die ausgefallendsten Musikstücke, wo nur Sekundenbruchteile verfügbar sind treffend zuordnen kann. Soviel zu gibt´s nicht & viel zu teuer.

Wenn da mal etwas durchrutscht liegt es einfach daran, dass entweder der entsprechende Rechteverwerter noch nicht bei YouTube / Google auf der Matte stand oder dass ein Musikstück bewusst so verändert wird (Störgeräusche, Bearbeitungen) dass es das Tool nicht mehr erkennen kann (sowie aufgrund der schlechten Qualität auch wenige Nutzer).

Benutzeravatar

» Subbotnik » Beiträge: 9308 » Talkpoints: -7,05 » Auszeichnung für 9000 Beiträge



Es mag ja sein, dass ich da mit meiner Einschätzung der technischen Umsetzbarkeit daneben lag. Ich bin auch nicht gerade häufig auf Youtube. Deshalb sind mir die Werbeeinblendungen beim Schreiben der Antwort gar nicht in den Sinn gekommen. Insofern lasse ich mich da auch gern korrigieren.

Aber eins ist sicher: Die Videos werden von Menschen geprüft. Dass die da absolut keine Chance haben, zeitnah auf alles zu reagieren, ist mir schon klar. Das macht die schiere Masse der Videos unmöglich. Aber lad mal ein Video hoch, in dem du erklärst, wie man an Kinderpornos kommt und warte mal ein paar Tage. Allein schon auf Grund der Zahl der verbotenen Inhalte und der Möglichkeiten, diese einzubinden, müssen die Betreiber die Clips, wenn auch nur zusätzlich, von Menschen ansehen lassen. Sonst gäbe es Youtube bestimmt schon lange nicht mehr, weil sie mittlerweile jemand vom Netz geklagt hätte.

Außerdem ist dein Hinweis auf die Schwierigkeiten beim Erkennen durch Menschen unpassend. Das Gegenteil ist der Fall. Eine Software musst du im Vorfeld mit jedem Titel einzeln füttern, damit diese ihn erkennt. Ein Mensch kann sich einfach fragen, ob er den Titel schon einmal irgendwo gehört hat. Dann ist es bereits so gut wie sicher, dass er auch von jemandem durch Copyright geschützt ist.

» ka mau » Beiträge: 203 » Talkpoints: 13,21 » Auszeichnung für 100 Beiträge



ka mau hat geschrieben:Aber lad mal ein Video hoch, in dem du erklärst, wie man an Kinderpornos kommt und warte mal ein paar Tage. Allein schon auf Grund der Zahl der verbotenen Inhalte und der Möglichkeiten, diese einzubinden, müssen die Betreiber die Clips, wenn auch nur zusätzlich, von Menschen ansehen lassen.

Ja und? Hat doch damit überhaupt nichts zu tun - das läuft über ein Meldesystem wie auch anderswo üblich. Nur wird kaum einer Videos mit geschützen Inhalten melden, einerseits aus Opportunismus, andererseits mangels Kenntnis.

Was Du hier anführst hat nichts mit dem Thema zu tun, denn es geht um eine (möglicherweiser) automatisierte Auswertung der Tonspuren und den Abgleich mit einer Datenbank. Hier müssen nur digitale Muster verglichen werden, das war`s.

ka mau hat geschrieben:Sonst gäbe es Youtube bestimmt schon lange nicht mehr, weil sie mittlerweile jemand vom Netz geklagt hätte.

Schau Dir mal an, was so alles an Klagen gegen YouTube läuft :D - u. A. auch deswegen.

ka mau hat geschrieben:Eine Software musst du im Vorfeld mit jedem Titel einzeln füttern, damit diese ihn erkennt. Ein Mensch kann sich einfach fragen, ob er den Titel schon einmal irgendwo gehört hat. Dann ist es bereits so gut wie sicher, dass er auch von jemandem durch Copyright geschützt ist.

Das ist doch völliger Schwachsinn, aber mal wirklich! Ich nehme mal an, Du hast von Computern keinerlei Ahnung, daher verzeihe ich Dir mal diesen Fauxpas, aber eine Datenbank zusammenzustellen, selbst wenn diese Millionen Titel umfasst, ist heutzutage ja wirklich kein Problem mehr. Die einzigen Faktoren die hier noch zählen ist der verfügbare Content und bis wann es erledigt sein muss, mehr nicht.

Und klar, menschliche Kontrolle bei dem Wulst an Inhalten der bei YouTube hochgeladen wird :D - träum weiter. Und nebenbei: Ich glaube nicht, dass Amerikaner (die letztendlich den Großteil in der Administration stellen) sich sehr gut mit deutschen Schlagern, afrikanischem Reggae oder chinesischer Popmusik auskennen und somit sagen "Das habe ich auf jeden Fall schon irgendwo gehört!". Außer Kim Peek hat seinen eigenen Tod überlebt und arbeitet als Vollzeitanalyst für Google :D.

Benutzeravatar

» Subbotnik » Beiträge: 9308 » Talkpoints: -7,05 » Auszeichnung für 9000 Beiträge


Eine Software musst du im Vorfeld mit jedem Titel einzeln füttern, damit diese ihn erkennt.

Wenn das "Schwachsinn" ist, dann erkläre mir mal bitte, wie das sonst funktionieren sollte. Erkennt die Software an Hand irgendeines Musters, das alle geschützten Titel gemeinsam haben, ungeschützte aber nie aufweisen, dass diese gefiltert werden müssen? Diese Aussage war im Übrigen auch lediglich auf deinen Kommentar bezogen, in dem du meintest, ein Mensch müsste jeden Titel mit den dazugehörigen Angaben kennen, um Songs identifizieren zu können. Und das ist, bei aller Liebe, falsch.

Außerdem wäre ich dir sehr dankbar, wenn du deinen Ton ein wenig anpassen könntest. Nur, weil ich hier Vermutungen äußere, diese auch explizit als solche zu erkennen gebe und hierbei vielleicht falsch liege, muss ich ja noch lange kein Neandertaler sein, was mein Technikverständnis angeht.

» ka mau » Beiträge: 203 » Talkpoints: 13,21 » Auszeichnung für 100 Beiträge


ka mau hat geschrieben:Erkennt die Software an Hand irgendeines Musters, das alle geschützten Titel gemeinsam haben, ungeschützte aber nie aufweisen, dass diese gefiltert werden müssen?

Simpel gesagt: Jedes Lied bzw. "Ton" kann man als Klangmuster darstellen - korrekt: akustischer Fingerabdruck. Man muss einfach nur alle Musikstücke die jemals veröffentlicht wurden einmal "durchrattern" lassen, damit diese der Datenbank zugeordnet werden können. Das ist auch kein großer Aufwand da jede Stimme sowie jedes Lied automatisch diesen akustischen Fingerabdruck hat (Spektrogramm), man muss ihn einfach nur einer anderen Größe (Titel) zuordnen bzw. einem Hashmark. Die meisten Anbieter dieser System (Shazam, Tunatic, MusicDNS, AudioID oder TRM) bekommen den jeweiligen Musikkatalog eines Rechteverwerters direkt zur Verfügung gestellt, je nachdem.

Diesen kann man dann extrem einfach mit einem anderen vergleichen der sich aus einem Vergleichsstück extrahieren lässt - die Haswerte sind so einzigartig, dass selbst bei einem "ewiglangem" Hashwert bei Stück A ein Schnipsel von Stück B (jedesmal die gleiche Aufnahme) davon in der Wertekette korrekt und eindeutig zugeordnet werden kann.

Letztendlich muss Youtube anhand der verwendeten Software nur feststellen, ob Genehmigungen (bzw.: keine Verbote) des Rechteverwertes / -inhabers vorliegen oder nicht und je nachdem das Video sperren oder nur das Soundfile (da Videos in den Video und Soundstream geteilt sind).

ka mau hat geschrieben:Diese Aussage war im Übrigen auch lediglich auf deinen Kommentar bezogen, in dem du meintest, ein Mensch müsste jeden Titel mit den dazugehörigen Angaben kennen, um Songs identifizieren zu können. Und das ist, bei aller Liebe, falsch.

Ah gut, dann kennst Du also alle Lieder dieser Welt, gut zu wissen :D. Ich nehme mal an, Du kannst dann auch auf Anhieb heraushören, welche rein akustischen Gypsy Swing Stücke aus den 20ern heute noch einem Schutz unterliegen und welche nicht mehr und um welche Aufnahme es sich jeweils im Detail handelt.

Benutzeravatar

» Subbotnik » Beiträge: 9308 » Talkpoints: -7,05 » Auszeichnung für 9000 Beiträge



Ähnliche Themen

Weitere interessante Themen

^