Suche

Nutzen Sie die Schnellsuche, um nach den neuesten Urteilen in unserer Datenbank zu suchen!

Bundesgerichtshof
Urt. v. 16.01.2024, Az.: X ZR 11/22
Streitpatent betreffnd die Verschleierung von Rahmenfehlern in linear prädiktiven Sprachkodierern
Gericht: BGH
Entscheidungsform: Urteil
Datum: 16.01.2024
Referenz: JurionRS 2024, 12689
Aktenzeichen: X ZR 11/22
ECLI: ECLI:DE:BGH:2024:160124UXZR11.22.0

Verfahrensgang:

vorgehend:

BPatG - 06.12.2021 - AZ: 4 Ni 9/21 (EP)

BGH, 16.01.2024 - X ZR 11/22

Redaktioneller Leitsatz:

Das mit Wirkung für die Bundesrepublik Deutschland erteilte europäische Patent 1 509 903, das die Verschleierung von Rahmenfehlern in linear prädiktiven Sprachkodierern betrifft, ist neu und beruht auf einer erfinderischen Tätigkeit.

Der X. Zivilsenat des Bundesgerichtshofs hat auf die mündliche Verhandlung vom 16. Januar 2024 durch den Vorsitzenden Richter Dr. Bacher, den Richter Hoffmann und die Richterinnen Dr. Kober-Dehm, Dr. Marx und Dr. Rombach
für Recht erkannt:

Tenor:

Die Berufung gegen das Urteil des 4. Senats (Nichtigkeitssenats) des Bundespatentgerichts vom 6. Dezember 2021 wird auf Kosten der Klägerin zurückgewiesen.

Tatbestand

1

Die Beklagte ist Inhaberin des mit Wirkung für die Bundesrepublik Deutschland erteilten europäischen Patents 1 509 903 (Streitpatents), das am 30. Mai 2003 unter Inanspruchnahme der Priorität einer kanadischen Patentanmeldung vom 31. Mai 2002 angemeldet wurde und die Verschleierung von Rahmenfehlern in linear prädiktiven Sprachkodierern betrifft.

2

Patentanspruch 1, auf den 37 Ansprüche zurückbezogen sind, lautet in der Verfahrenssprache:

A method of concealing frame erasure caused by frames of an encoded sound signal erased during transmission from an encoder to a decoder, and for accelerating recovery of the decoder after non erased frames of the encoded sound signal have been received, comprising: determining, in the encoder, concealment/recovery parameters comprising at least two parameters selected from the group consisting of a signal classification parameter, an energy information parameter, a voicing information parameter and a phase information parameter;

quantizing the concealment/recovery parameters; and transmitting to the decoder the quantized concealment/recovery parameters determined in the encoder;

wherein: the concealment/recovery parameters are usable to improve frame erasure concealment and recovery of the decoder after frame erasure; the sound signal is a speech signal;

characterized in that: determining, in the encoder, the concealment/recovery parameters comprises classifying successive frames of the encoded sound signal as unvoiced, unvoiced transition, voiced transition, voiced, or onset; and determining the concealment/recovery parameters comprises calculating the energy information parameter in relation to a maximum of a signal energy for frames classified as voiced or onset, and calculating the energy information parameter in relation to an average energy per sample for other frames.

3

Patentanspruch 39, auf den 14 Ansprüche zurückbezogen sind, lautet:

A method for the concealment of frame erasure caused by frames erased during transmission of a sound signal encoded under the form of signal encoding parameters from an encoder to a decoder, and for accelerating recovery of the decoder after non erased frames of the encoded sound signal have been received, comprising: determining, in the decoder, concealment/recovery parameters from the signal-encoding parameters, the concealment/recovery parameters comprising at least two parameters selected from the group consisting of a signal classification parameter, an energy information parameter, a voicing information parameter and a phase information parameter; and in the decoder, conducting erased frame concealment and decoder recovery in response to the concealment/recovery parameters determined in the decoder;

wherein: the sound signal is a speech signal;

characterized in that: determining, in the decoder, the concealment/recovery parameters comprises classifying successive frames of the encoded sound signal as unvoiced, unvoiced transition, voiced transition, voiced, or onset; and determining the concealment/recovery parameters comprises calculating the energy information parameter in relation to a maximum of a signal energy for frames classified as voiced or onset, and calculating the energy information parameter in relation to an average energy per sample for other frames.

4

Patentanspruch 54, auf den 20 Ansprüche zurückbezogen sind, sowie Patentanspruch 75, auf den 14 Ansprüche zurückbezogen sind, schützen Vorrichtungen mit entsprechenden Merkmalen. Die Patentansprüche 90 und 91 stellen einen Dekodierer bzw. einen Kodierer unter Schutz.

5

Die Klägerin strebt die Nichtigerklärung des Streitpatents im Umfang der Patentansprüche 1, 10, 29 bis 33, 39, 48 bis 52, 54, 63, 75, 80, 83 bis 88, 90 und 91 an. Sie macht geltend, der angegriffene Gegenstand sei nicht patentfähig und nicht so offenbart, dass ein Fachmann die Erfindung ausführen könne. Die Beklagte hat die angegriffenen Ansprüche in der erteilten Fassung und mit zwei geänderten Fassungen verteidigt.

6

Das Patentgericht hat die Klage abgewiesen.

7

Dagegen richtet sich die Berufung der Klägerin, die ihren erstinstanzlichen Antrag weiterverfolgt. Die Beklagte tritt dem Rechtsmittel mit ihren erstinstanzlichen Anträgen sowie einem weiteren Hilfsantrag entgegen.

Entscheidungsgründe

8

Die zulässige Berufung hat in der Sache keinen Erfolg.

9

I. Das Streitpatent betrifft die Verschleierung von Rahmenfehlern in linear prädiktiven Sprachkodierern.

10

1. Die Streitpatentschrift beschreibt im Stand der Technik bekannte Methoden zur Sprachkodierung.

11

Das Sprachsignal wird hierbei abgetastet und quantisiert. Der abbildbare Frequenzbereich und damit die subjektive Qualität der Aufnahme hängt von der Abtastfrequenz ab (Abs. 2). Die digitalen Abtastwerte werden einer Kodierung unterzogen, um die Anzahl der benötigten Bits zu reduzieren (Abs. 3). Auch damit kann ein Qualitätsverlust einhergehen.

12

Nach der Beschreibung des Streitpatents ermöglicht die Kodiermethode CELP (Code-Excited Linear Prediction) einen guten Kompromiss zwischen subjektiver Qualität und Bitrate. Dabei werde das abgetastete Sprachsignal in aufeinanderfolgenden Blöcken von mehreren Abtastwerten verarbeitet, die in der Regel als Rahmen bezeichnet würden. Ein Rahmen werde in kleinere Blöcke, so genannte Subrahmen (Subframes) unterteilt. In jedem Subrahmen werde ein Anregungssignal in der Regel aus zwei Komponenten gewonnen, der vergangenen Anregung (past excitation) und der innovativen Anregung (innovative excitation). Die zuerst genannte Komponente werde oft als adaptive Codebuch- oder Pitch-Anregung bezeichnet. Die zweite Komponente beruhe auf einem festen Codebuch (Abs. 4).

13

Hauptanwendungen der Sprachkodierung mit niedriger Bitrate seien drahtlose Mobilkommunikationssysteme und Voice-over-Packet-Netzwerke. Deshalb sei die Erhöhung der Robustheit der Sprachcodecs im Fall von Rahmenlöschungen von erheblicher Bedeutung. In solchen Systemen träten typischerweise Rahmenlöschraten von 3 bis 5 % auf. Darüber hinaus sei Breitband-Sprachkodierung ein wichtiger Vorteil dieser Systeme, damit sie mit dem traditionellen öffentlichen Telefonnetz (PSTN) konkurrieren könnten, das die alten Schmalband-Sprachsignale verwende (Abs. 5).

14

Das adaptive Codebuch oder der Pitch-Prädiktor in CELP spiele eine wichtige Rolle bei der Aufrechterhaltung einer hohen Sprachqualität bei niedrigen Bitraten. Da der Inhalt des adaptiven Codebuchs jedoch auf dem Signal vergangener Rahmen basiere, reagiere der Codec-Modus empfindlich auf einen Rahmen-Verlust. Im Falle von gelöschten oder verlorenen Rahmen unterscheide sich der Inhalt des adaptiven Codebuchs im Dekodierer von seinem Inhalt im Kodierer. Die Auswirkung des verlorenen Rahmens hänge von der Art des Sprachsegments ab, in dem die Löschung stattgefunden habe. Wenn das Löschen in einem stationären Segment auftrete, könne eine wirksame Rahmenlöschungs-Verschleierung durchgeführt und die Auswirkung auf nachfolgende gute Rahmen minimiert werden. Wenn das Löschen bei einem Sprachbeginn oder einem Übergang auftrete, könne sich der Effekt über mehrere Rahmen ausbreiten. Wenn beispielsweise der Anfang eines stimmhaften Segments verlorengehe, fehle die erste Pitch-Periode im Inhalt des adaptiven Codebuchs. Dies habe schwerwiegende Auswirkungen auf den Pitch-Prädiktor in darauffolgenden guten Rahmen. Dann dauere es lange Zeit, bevor das Synthesematerial zum beabsichtigten Signal konvergiere (Abs. 6).

15

2. Das Streitpatent betrifft vor diesem Hintergrund das technische Problem, die Verschleierung der Rahmenlöschung zu verbessern und die Wiederherstellung des Dekodierers zu beschleunigen.

16

3. Zur Lösung schlägt das Streitpatent in Patentanspruch 1 ein Verfahren vor, dessen Merkmale sich wie folgt gliedern lassen:

17
1A method of concealing frame erasure caused by frames of an encoded sound signal erased during transmission from an encoder to a decoder, and for accelerating recovery of the decoder after non-erased frames of the encoded sound signal have been received.Verfahren zum Verschleiern einer Rahmenlöschung, die durch Rahmen eines kodierten Tonsignals verursacht wird, die während der Übermittlung von einem Kodierer zu einem Dekodierer gelöscht werden, und zum Beschleunigen einer Wiederherstellung des Dekodierers, nachdem nicht gelöschte Rahmen des kodierten Tonsignals empfangen wurden.
2The sound signal is a speech signal.Das Tonsignal ist ein Sprachsignal.
3Determining, in the encoder, concealment/recovery parameters,Im Kodierer werden Verschleierungs-/Wiederherstellungsparameter ermittelt,
6which are usable to improve frame erasure concealment and recovery of the decoder after frame erasure;die zur Verbesserung des Verschleierns einer Rahmenlöschung und des Wiederherstellens des Dekodierers nach einer Rahmenlöschung verwendbar sind;
3.1comprising at least two parameters selected from the group consisting of a signal classification parameter, an energy information parameter, a voicing information parameter and a phase information parameter.von denen zumindest zwei Parameter aus der nachfolgenden Gruppe ausgewählt sind: Signalklassifizierungs-, Energieinformations-, Stimmhaftigkeitsinformations- und Phaseninformationsparameter.
3.2Determining, in the encoder, the concealment/recovery parameters comprises classifying successive frames of the encoded sound signal as unvoiced, unvoiced transition, voiced transition, voiced, or onset.Die Ermittlung im Kodierer umfasst ein Klassifizieren aufeinanderfolgender Rahmen des kodierten Tonsignals als stimmlos, stimmloser Übergang, stimmhafter Übergang, stimmhaft oder Einsetzen.
3.3Determining the concealment/recovery parameters comprises calculating the energy information parameter in relation to:Die Ermittlung umfasst ein Berechnen des Energieinformationsparameters in Relation zu:
3.3.1a maximum of a signal energy for frames classified as voiced or onset;einem Maximum einer Signalenergie für Rahmen, die als stimmhaft oder Einsetzen klassifiziert sind;
3.3.2an average energy per sample for other frames.einer Durchschnittsenergie pro Abtastung für andere Rahmen.
4The concealment/recovery parameters are quantized.Die Verschleierungs-/Wiederherstellungsparameter werden quantisiert.
5The quantized concealment/recovery parameters determined in the encoder are transmitted to the decoder.Die im Kodierer ermittelten quantisierten Verschleierungs-Wiederherstellungsparameter werden an den Dekodierer übermittelt.
18

4. Einige Merkmale bedürfen der näheren Erläuterung.

19

a) Die Verfahren nach den Ansprüchen 1 und 39 zielen darauf ab, die Maßnahmen zur Kompensation von Rahmen-Löschungen an die Art des von der Löschung betroffenen Sprachsignals anzupassen.

20

Nach der Beschreibung des Streitpatents erfordert eine solche Anpassung die Klassifizierung jedes einzelnen Sprachrahmens (Abs. 64). Hierbei müssten die Signalenergie, das Maß der Periodizität, die Spektral-Hüllkurve und die Pitch-Periode untersucht werden. Bei stimmhafter Sprache könne eine weitere Verbesserung durch eine Phasenkontrolle erreicht werden (Abs. 65). Bei einer geringen Erhöhung der Bitrate könnten zusätzliche Parameter quantisiert und übermittelt werden. Wenn keine zusätzliche Bandbreite verfügbar sei, könnten die Parameter im Dekodierer geschätzt werden (Abs. 65). Dem liege die Grundidee zu Grunde, dass sich die ideale Verschleierungs-Strategie für quasistationäre Sprachsegmente von derjenigen für Sprachsegmente mit rasch wechselnden Eigenschaften unterscheide (Abs. 71).

21

b) In Einklang mit diesem Ansatz sehen die Merkmale 3 und 6 die Ermittlung von Parametern vor, die zur Verbesserung der Verschleierung oder Wiederherstellung eingesetzt werden können. Dieser Vorgang wird durch die Merkmale 3.1 und 3.2 näher spezifiziert.

22

aa) Nach Merkmal 3.1 müssen mindestens zwei Parameter ausgewählt sein aus einer Gruppe von Parametern, die sich auf Signalklassifizierung, Energieinformation, Stimmhaftigkeit oder Phaseninformation beziehen. Die Phaseninformation gibt die Position des ersten glottalen Impulses in einem Rahmen an (Abs. 108).

23

In diesem Zusammenhang bedarf es keiner Entscheidung, ob Merkmal 3.1 verlangt, dass der Kodierer für die Ermittlung und Übertragung sämtlicher Parameter ausgerüstet sein muss oder ob es reicht, wenn er nur zwei Parameter zur Verfügung stellen kann. Auch auf der Grundlage der weiteren Auslegung erweist sich das Streitpatent aus den unten aufgezeigten Gründen als rechtsbeständig.

24

bb) Aus der Zusammenschau mit der Merkmalsgruppe 3.3 ergibt sich, dass die Ermittlung eines Energieinformationsparameters stets zwingend ist.

25

Die Merkmalsgruppe 3.3 enthält nicht nur Vorgaben zu der Art und Weise, in der ein solcher Parameter zu berechnen ist. Merkmal 3.3 schreibt vielmehr zwingend vor, dass die Ermittlung eine solche Berechnung umfasst.

26

cc) Gemäß Merkmal 3.2 müssen ferner die einzelnen Rahmen einer der dort aufgeführten Klassen (unvoiced, unvoiced transition, voiced transition, voiced, onset) zugeordnet werden.

27

(1) Bei dem in der Beschreibung des Streitpatents geschilderten Beispiel werden hierzu verschiedene Signalklassifizierungsparameter ermittelt und mit Hilfe von (experimentell ermittelten) Koeffizienten kp und cp so skaliert, dass sie einen Wert zwischen 0 und 1 haben (Abs. 78-94). Die hierbei herangezogenen Parameter und Koeffizienten sind in der nachfolgend wiedergegebenen Tabelle 2 aufgeführt.

string
28

Der erste dieser Parameter (normalized correlation(s)) wird in diesem Zusammenhang auch als voicing information bezeichnet (Abs. 99).

29

(2) Aus den skalierten Parameterwerten wird mittels einer Gütefunktion (merit function) ein gewichteter Durchschnittswert fm ermittelt, der ebenfalls einen Wert zwischen 0 und 1 haben kann. Die Klassifizierung eines Rahmens erfolgt anhand dieses Durchschnittswerts und anhand der Klasse des vorangehenden Rahmens, wie dies in der nachfolgend wiedergegebenen Tabelle 3 aufgeführt ist (Abs. 95 f.).

string
30

(3) Merkmal 3.2 gibt nicht vor, welche Parameter zur Klassifizierung der Rahmen heranzuziehen und in welcher Weise die einzelnen Parameter bei der Klassifizierung zu berücksichtigen sind.

31

Patentanspruch 10 schreibt demgegenüber vor, dass zumindest ein Teil der in Tabelle 2 aufgeführten Parameter zur Klassifizierung aufeinanderfolgender Rahmen herangezogen wird.

32

dd) Patentanspruch 1 legt nicht fest, in welchem Verhältnis die in Merkmal 3.1 aufgeführten Parameter zu der in Merkmal 3.2 vorgesehenen Klassifizierung aufeinanderfolgender Rahmen stehen.

33

Aus dem oben dargestellten Ausführungsbeispiel ergibt sich, dass die Klassifizierung der Rahmen anhand von Signalklassifizierungsparametern erfolgen kann, wie sie allgemein auch in Merkmal 3.1 vorgesehen sind. Als Klassifizierungsparameter in diesem Sinne werden in dem Ausführungsbeispiel unter anderem die in Merkmal 3.1 aufgeführten Energieinformations- und Stimmhaftigkeitsinformations-Parameter herangezogen, nicht aber die ebenfalls in Merkmal 3.1 aufgeführte Phaseninformation. Daraus folgt, dass alle gemäß Merkmal 3.1 ermittelten Parameter zum Klassifizieren aufeinanderfolgender Rahmen herangezogen werden können, dass dies aber nicht zwingend ist.

34

Entgegen der Auffassung der Klägerin ergibt sich aus der nachfolgend wiedergegebenen Figur 5 des Streitpatents keine abweichende Beurteilung.

string
35

Aus dieser Figur ergibt sich zwar, dass bei dem dargestellten Ausführungsbeispiel anstelle der zur Signalklassifizierung herangezogenen Parameter lediglich die ermittelte Klasse an den Dekodierer übermittelt wird. Daraus folgt aber nicht, dass die Übermittlung von Klassifizierungsparametern unzulässig ist.

36

c) Merkmalsgruppe 3.3 macht die Berechnung eines Energieinformationsparameters abhängig von der Klassifizierung des Rahmens.

37

aa) Zu Recht hat das Patentgericht angenommen, dass Merkmal 3.3.1 nicht vorgibt, anhand welcher Einzelwerte der maßgebliche Maximalwert zu ermitteln ist.

38

Wie das Patentgericht näher dargelegt hat, wird der Maximalwert im Sinne von Merkmal 3.3.1 bei dem in der Beschreibung des Streitpatents geschilderten Ausführungsbeispiel anhand von Einzelwerten eines Teils des jeweiligen Rahmens ermittelt (Abs. 110).

39

Entgegen der Auffassung der Berufung ergibt sich daraus nicht, dass Merkmal 3.3.1 von der Beschreibung abweicht. Vielmehr ist dieses Merkmal im Lichte der Beschreibung dahin auszulegen, dass die Heranziehung eines Teils dieses Rahmens genügt. Dieser Auslegung stehen weder der Wortlaut von Merkmal 3.3.1 noch sonstige Umstände entgegen.

40

Wie das Patentgericht ebenfalls zutreffend angenommen hat, schreibt Merkmal 3.3.1 die im Ausführungsbeispiel gewählte Vorgehensweise nicht zwingend vor. Es lässt vielmehr die Freiheit, andere Bereiche des Rahmens oder wahlweise auch den gesamten Rahmen in die Betrachtung einzubeziehen. Ob darüber hinaus auch Werte aus anderen Rahmen Berücksichtigung finden dürfen, ist für die Entscheidung über die Nichtigkeitsklage nicht erheblich.

41

bb) Entgegen der Auffassung der Berufung ist die in Merkmal 3.3.2 vorgegebene Berechnungsweise nicht mit derjenigen aus Merkmal 3.3.1 identisch.

42

(1) Die in beiden Merkmalen enthaltene Formulierung "in relation to" eröffnet allerdings die Möglichkeit, den ermittelten Maximal- bzw. Durchschnittswert weiteren Rechenoperationen zu unterziehen.

43

Wie das Patentgericht zutreffend dargelegt hat, wird bei dem in der Beschreibung des Streitpatents geschilderten Ausführungsbeispiel der mittels einer Formel (16) ermittelte Maximalwert E einer weiteren Rechenoperation gemäß einer Formel (15) unterzogen, um die Information mit einer möglichst geringen Anzahl an Bits übertragen zu können. Derselben Rechenoperation wird auch der anhand einer Formel (17) ermittelte Durchschnittswert E unterzogen (Abs. 110).

44

(2) Hieraus ergibt sich jedoch nicht, dass es genügt, wenn der Maximalwert bzw. der Durchschnittswert nur in irgendeiner Weise in die Berechnung einfließt.

45

Im Lichte der Beschreibung ist die Formulierung "in relation to" vielmehr dahin zu verstehen, dass der ermittelte Wert auch im Falle ergänzender Rechenoperationen einen Rückschluss auf den Ausgangswert ermöglichen muss, also auf den Maximalwert im Falle von Merkmal 3.3.1 und auf den Durchschnittswert im Falle von Merkmal 3.3.2.

46

cc) Entgegen der Auffassung der Berufung folgt aus dem Umstand, dass Merkmal 3.3 nur zwischen zwei unterschiedlichen Rahmenarten unterscheidet, nicht, dass die übrigen in Merkmal 3.2 vorgesehenen Rahmenklassen technisch bedeutungslos sind.

47

Wie die Berufungserwiderung zu Recht darlegt, ermöglicht es die in Merkmal 3.2 vorgesehene Einteilung in fünf Rahmenklassen nach der Beschreibung, unterschiedliche Methoden zur Kompensation von Rahmenlöschungen anzuwenden (Abs. 76). Diese Möglichkeit hängt nicht allein von der Berechnung von Energieinformationsparametern gemäß der Merkmalsgruppe 3.3 ab.

48

d) Als Quantisieren im Sinne von Merkmal 4 ist das Abbilden einer Wertemenge auf eine kleinere Menge zu verstehen.

49

aa) Zu Recht ist das Patentgericht davon ausgegangen, dass ein Quantisieren im Sinne von Merkmal 4 nicht zwingend wertekontinuierliche Parameter als Ausgangsmenge voraussetzt.

50

Für das vom Patentgericht zugrunde gelegte Verständnis spricht der Umstand, dass die Beschreibung des Streitpatents ein Quantisieren auch für Ausgangswerte schildert, die bereits in digitaler Form vorliegen (Abs. 114). Letzteres zieht auch die Berufung nicht in Zweifel.

51

bb) Entgegen der Auffassung der Berufung ergibt sich hieraus nicht, dass jede beliebige Art der Kodierung ein Quantisieren im Sinne von Merkmal 4 darstellt.

52

(1) Auch das Patentgericht ist davon ausgegangen, dass eine Quantisierung die Codierung mit einer bestimmten Präzision erfordert. Damit geht Information, die ein höheres Maß an Präzision aufweist, verloren.

53

(2) Dieses Verständnis steht in Einklang mit der Beschreibung des Streitpatents.

54

Die Beschreibung verwendet den Begriff "Quantisieren" teils im Zusammenhang mit der Digitalisierung kontinuierlicher Werte (Abs. 3, 25 ff., 40, 109 f., 115 ff.), teils im Zusammenhang mit der Reduzierung der Anzahl an zu übertragenden Bits bei digitalen Ausgangswerten (Abs. 114).

55

Diese Vorgänge sind mit einem Informationsverlust verbunden, weil mehrere unterschiedliche Ausgangswerte auf denselben Wert abgebildet werden können.

56

(3) Für die in der Beschreibung geschilderte - nicht ausdrücklich als Quantisierung bezeichnete - Übertragung von fünf verschiedenen Rahmenklassen mit zwei Bit - also mit nur vier unterschiedlichen Zahlenwerten - gilt entgegen der Auffassung der Berufung nichts anderes.

57

Nach der Beschreibung kann der Empfänger allerdings auch bei dieser Vorgehensweise alle fünf Rahmenklassen voneinander unterscheiden, weil die Klassen "unvoiced transition" und "voiced transition" anhand der Klasse des vorangehenden Rahmens voneinander unterschieden werden können und deshalb denselben Zahlenwert erhalten können (Abs. 77).

58

Auch dieser Vorgang ist jedoch mit einem Informationsverlust verbunden. Dieser tritt dadurch ein, dass die fünf unterschiedlichen Ausgangswerte auf vier unterschiedliche Werte reduziert werden und deshalb die beiden Klassen "unvoiced transition" und "voiced transition" nicht allein anhand des übermittelten, durch Quantisierung erhaltenen Zahlenwerts unterschieden werden können.

59

Dass die auf diese Weise verloren gegangene Information auf anderem Wege ermittelt werden kann, nämlich anhand der Klasse des vorangegangenen Rahmens, führt nicht zu einer abweichenden Beurteilung. Diese Vorgehensweise vermag den mit der Reduzierung auf zwei Bit eintretenden Informationsverlust nicht zu verhindern. Sie ermöglicht lediglich, die verlorene Information zu rekonstruieren.

60

e) Es bedarf keiner Entscheidung, ob die Quantisierung und Übermittlung sich auf sämtliche in Merkmalen 3.1 bis 3.3 genannten Parameter beziehen muss oder nur auf solche, die in den Merkmalen 3.1 und/oder 3.2 als zwingend vorgesehen sind. Es bedarf in diesem Zusammenhang auch keiner Entscheidung, ob der zwingend zu ermittelnde Energieinformationsparameter (Merkmal 3.3) auch im Dekodierer ermittelt werden kann, was zur Folge hätte, dass eine Übertragung und Quantisierung durch den Kodierer nicht zwingend ist.

61

5. Patentanspruch 39 schlägt ein Verfahren vor, dessen Merkmale sich wie folgt gliedern lassen (Abweichungen gegenüber Patentanspruch 1 sind hervorgehoben):

62
1aA method of concealingfor the concealment frame erasure caused by frames of an encoded sound signal erased during transmission of a sound signal encoded under the form of signal encoding parameters from an encoder to a decoder, and for accelerating recovery of the decoder after non-erased frames of the encoded sound signal have been received.Verfahren zum Verschleiern zur Verschleierung einer Rahmenlöschung, die durch Rahmen eines kodierten Tonsignals verursacht wird, die während der Übermittlung eines unter der Form von Signalkodierungsparametern kodierten Tonsignals von einem Kodierer zu einem Dekodierer gelöscht werden, und zum Beschleunigen einer Wiederherstellung des Dekodierers, nachdem nicht gelöschte Rahmen des kodierten Tonsignals empfangen wurden.
2aThe sound signal is a speech signal.Das Tonsignal ist ein Sprachsignal.
3aDetermining, in the encoder decoder, concealment/recovery parameters from the signal-encoding parameters,Im KodiererDekodierer werden Verschleierungs-/Wiederherstellungsparameter aus den Signalkodierungsparametern ermittelt,
3.1acomprising at least two parameters selected from the group consisting of a signal classification parameter, an energy information parameter, a voicing information parameter and a phase information parameter.von denen zumindest zwei Parameter aus der nachfolgenden Gruppe ausgewählt sind: Signalklassifizierungs-, Energieinformations-, Stimmhaftigkeitsinformations- und Phaseninformationsparameter.
6aConducting, in the decoder, erased frame concealment and decoder recovery in response to the concealment/recovery parameters determined in the decoder.Im Dekodierer werden gelöschte Rahmen verschleiert und der Dekodierer wiederhergestellt in Antwort auf die im Dekodierer ermittelten Verschleierungs-/Wiederherstellungsparameter.
3.2aDetermining, in the encoder decoder, the concealment/recovery parameters comprises classifying successive frames of the encoded sound signal as unvoiced, unvoiced transition, voiced transition, voiced, or onset.Die Ermittlung im KodiererDekodierer umfasst ein Klassifizieren aufeinanderfolgender Rahmen des kodierten Tonsignals als stimmlos, stimmloser Übergang, stimmhafter Übergang, stimmhaft oder Einsetzen.
3.3Determining the concealment/recovery parameters comprises calculating the energy information parameter in relation to:Die Ermittlung umfasst ein Berechnen des Energieinformationsparameters in Relation zu:
3.3.1a maximum of a signal energy for frames classified as voiced or onset;einem Maximum einer Signalenergie für Rahmen, die als stimmhaft oder Einsetzen klassifiziert sind;
3.3.2an average energy per sample for other frames.einer Durchschnittsenergie pro Abtastung für andere Rahmen.
63

6. Der Gegenstand von Patentanspruch 39 unterscheidet sich im Wesentlichen in zwei Aspekten von demjenigen des Anspruchs 1.

64

a) Die für die Kompensation von Rahmenlöschungen herangezogenen Parameter werden anders als bei Anspruch 1 nicht im Kodierer ermittelt, sondern im Dekodierer.

65

b) Während Anspruch 1 eine Übermittlung von Verschleierungs- bzw. Wiederherstellungsparametern vom Kodierer an den Dekodierer vorsieht, schreibt Merkmal 3a vor, dass der Dekodierer diese Parameter aus den Signalkodierungsparametern ermittelt.

66

Wie die Berufungserwiderung zutreffend darlegt, bedeutet dies, dass der Dekodierer nicht auf Verschleierungs-/Wiederherstellungsparameter zurückgreift, die der Kodierer ermittelt und übersandt hat, sondern diese Parameter anhand der Parameter für die Signalkodierung selbst ermittelt, wie dies die Merkmale 3.1a und 3.2a ausdrücklich vorsehen.

67

7. Die durch die Ansprüche 54, 75, 90 und 91 geschützten Vorrichtungen werden durch ihre Eignung für die definierten Verfahrensschritte geprägt und unterliegen deshalb derselben Beurteilung wie die korrespondierenden Verfahrensansprüche.

68

II. Das Patentgericht hat seine Entscheidung, soweit für das Berufungsverfahren von Interesse, im Wesentlichen wie folgt begründet:

69

Die Erfindung sei so offenbart, dass ein Fachmann - ein Ingenieur der Elektro- und Nachrichtentechnik mit Universitätsabschluss (Diplom oder Master) und mehrjähriger Berufserfahrung sowie mit einschlägigen Kenntnissen auf dem Gebiet der digitalen Signalverarbeitung, insbesondere der Kodierung von Sprachsignalen - sie ausführen könne. Dies gelte auch für das Quantisieren der Signalklassifizierungsparameter.

70

Der Gegenstand von Patentanspruch 1 sei gegenüber der internationalen Patentanmeldung 01/86637 (K3) neu. K3 offenbare weder unmittelbar noch eindeutig eine Klasse "Onset" noch ein Berechnen des Energieinformationsparameters in Relation zu einem Maximum einer Signalenergie für stimmhafte oder als Einsetzen klassifizierte Rahmen.

71

Der Gegenstand von Patentanspruch 1 beruhe auch auf erfinderischer Tätigkeit. K3 gebe keine Anregungen oder Hinweise, den Energieinformationsparameter in Abhängigkeit der Rahmenklasse zu bestimmen und diesen in Relation zu einem Maximum einer Signalenergie für stimmhafte oder als Einsetzen klassifizierte Rahmen zu berechnen. Eine Tonhöhenepoche, über die nach K3 die Wurzel des quadratischen Mittelwerts der Energie des Sprachsignals zu berechnen sei, werde nicht nur in stimmhaften Sprachsegmenten bestimmt, sondern in allen Unterrahmen des Sprachsignals bei der Suche im adaptiven Codebuch.

72

Auch bei Hinzunahme des Fachbuchs von Kondoz (K4) lägen die genannten Maßnahmen nicht nahe. Entgegen der Auffassung der Klägerin sei die Figur 3.1 in K4 kein Beleg dafür, dass der Fachmann benachbarte Signalspitzen stimmhafter Signale möglichst aneinander angleichen würde. Diese Figur zeige lediglich exemplarische Signalformen stimmhafter und stimmloser Signale. In der Streitpatentschrift erfahre der Fachmann demgegenüber, dass bei einer Rahmenlöschung eines stimmhaften Sprachsegments das Anregungssignal des letzten guten Rahmens typischerweise mit einer Dämpfungsstrategie zur Verschleierung der Rahmenlöschung verwendet werde. Wenn nach der Rahmenlöschung ein neues lineares Vorhersagefilter (LP Filter) mit dem ersten guten Rahmen im Dekodierer eintreffe, könne es zu einer Fehlanpassung zwischen der Energie des Anregungssignals und der Verstärkung des neuen linearen Vorhersagefilters kommen. Daher sei die Einstellung der Signalenergie bei Rahmenlöschung während stimmhafter Sprachsegmente am wichtigsten (Abs. 143). Zu derartigen Überlegungen des Streitpatents enthielten weder K3 noch K4 Anregungen oder Hinweise.

73

Entsprechendes gelte für die Gegenstände der anderen angegriffenen Ansprüche.

74

III. Diese Beurteilung hält der Überprüfung im Berufungsrechtszug stand.

75

1. Der Gegenstand von Patentanspruch 1 geht nicht über den Inhalt der ursprünglich eingereichten Unterlagen hinaus.

76

a) Die erstmalige Geltendmachung dieses Nichtigkeitsgrundes in der Berufungsinstanz ist gemäß § 116 Abs. 2 PatG zulässig.

77

Die darin liegende Antragsänderung ist sachdienlich, weil sie eine umfassende Erledigung der Auseinandersetzung über den Rechtsbestand des Streitpatents ermöglicht. Die für die Beurteilung des geänderten Antrags maßgeblichen Tatsachen stimmen mit denjenigen überein, die zur Beurteilung der bereits in erster Instanz geltend gemachten Nichtigkeitsgründe ohnehin herangezogen werden müssen.

78

b) Entgegen der Auffassung der Berufung geht der Gegenstand von Patentanspruch 1 nicht deshalb über den Inhalt der ursprünglich eingereichten Unterlagen hinaus, weil Patentanspruch 1 anders als der in der Anmeldung formulierte Anspruch 1 keine Vorgaben hinsichtlich der im Dekodierer auszuführenden Verfahrensschritte enthält.

79

Die ursprünglichen Unterlagen, deren Inhalt mit der Offenlegungsschrift (WO 03/102921 A 1, NB11) übereinstimmt, offenbaren - ebenso wie die Beschreibung des Streitpatents - sowohl die Kodierung als auch die Dekodierung von Signalen. Dem bereits in der Anmeldung enthaltenen Hinweis, dass die in Rede stehenden Sprachsignale nicht nur über einen Kommunikationskanal übermittelt, sondern wahlweise auch auf einem Speichermedium gespeichert werden können (S. 2 Z. 1 f.), lässt sich entnehmen, dass der Gegenstand der offenbarten Lehre nicht auf die Interaktion zwischen Kodierer und Dekodierer beschränkt ist, sondern die im Kodierer auszuführenden Verfahrensschritte auch für sich gesehen zur Erfindung gehören.

80

Darüber hinaus wird bereits in der Anmeldung ausgeführt, dass die im Mittelpunkt stehende Klassifikation einzelner Rahmen wahlweise im Kodierer oder im Dekodierer erfolgen kann (S. 11 Z. 17-19). Daraus ergibt sich hinreichend deutlich, dass nicht nur das in Anspruch 1 der Anmeldung definierte Zusammenspiel aus Ermittlung und Übersendung der Parameter durch den Kodierer und Weiterverarbeitung der erhaltenen Parameter durch den Dekodierer zum Gegenstand der beanspruchten Erfindung gehört.

81

Dass von Patentanspruch 1 auch eine Ausgestaltung umfasst ist, bei der ein Kodierer zugleich eine Dekodier-Komponente enthält, führt nicht zu einer abweichenden Beurteilung. Schon aus der Anmeldung geht hinreichend deutlich hervor, dass es nur darum geht, die dort beschriebenen Kodier- bzw. Dekodierschritte durchzuführen, und dass es nicht ausgeschlossen ist, wenn eine für diese Zwecke eingesetzte Vorrichtung daneben noch weitere Funktionen umfasst.

82

c) Entgegen der Auffassung der Berufung ist der Anmeldung zu entnehmen, dass bei der Klassifizierung der Rahmen nicht zwingend alle Parameter aus Tabelle 2 (S. 35 oben) herangezogen werden müssen.

83

Ebenso wie das Streitpatent führt die Anmeldung zu Beginn der diesbezüglichen Darlegungen aus, dass es sich um eine veranschaulichende Ausführungsform (S. 25 Z. 8: illustrative embodiment) handelt, also um ein Ausführungsbeispiel.

84

Daraus ergibt sich hinreichend deutlich, dass es nicht auf alle Einzelheiten des geschilderten Beispiels ankommt, sondern darauf, anhand geeigneter Parameter zwischen verschiedenen Rahmenklassen zu unterscheiden.

85

d) Bezüglich der Auswahl von Parametern aus der in Merkmal 3.1 aufgeführten Gruppe enthält die Beschreibung der Anmeldung den ausdrücklichen Hinweis, dass Verfahren zur Ermittlung und Übertragung von Parametern offenbart werden, wobei zwei oder mehr der in Merkmal 3.1 aufgezählten Parameter erfasst werden (S. 22 Z. 1-7).

86

Dies reicht für eine ursprüngliche Offenbarung von Merkmal 3.1 auch dann aus, wenn man unterstellt, dass dieses Merkmal nicht zwingend voraussetzt, dass der Kodierer grundsätzlich in der Lage ist, sämtliche der dort genannten Parameter zu ermitteln und zu übertragen.

87

Dass diese Festlegung keine optimalen Ergebnisse gewährleistet, ist schon deshalb unerheblich, weil auch der Gegenstand der Anmeldung nicht auf eine optimale Lösung beschränkt ist.

88

Eine abweichende Beurteilung ergibt sich auch nicht daraus, dass die Anmeldung an der besagten Stelle den ersten Parameter der Gruppe mit "frame classification" bezeichnet, während Merkmal 3.1 den Begriff "signal classification" verwendet. Bei der Schilderung des Ausführungsbeispiels werden die zur Klassifizierung von Rahmen herangezogenen, in Tabelle 2 aufgeführten Parameter als Signalklassifizierungsparameter bezeichnet. Damit wird hinreichend deutlich, dass zu den einleitend unter dem Stichwort "frame classification" gehörenden Parametern nicht nur das Ergebnis der Klassifikation gehört, sondern auch die für die Klassifikation eingesetzten Parameter.

89

Dass die Anmeldung - auch insoweit übereinstimmend mit dem Streitpatent (Abs. 72 und 76) - für die Einteilung in Signalklassen (S. 23 Z. 29 ff.) zum Teil andere Kategorien benennt als für die Einteilung in Rahmenklassen (S. 25 f.), führt schon deshalb nicht zu einer abweichenden Beurteilung, weil bereits die Anmeldung den ausdrücklichen Hinweis enthält, für die Zwecke der Fehlerverschleierung könnten einige Signalklassen zu einer Gruppe zusammengefasst werden (S. 24 Z. 16-18).

90

e) Entgegen der Auffassung der Berufung offenbart die Anmeldung auch das Quantisieren eines Signalklassifizierungsparameters.

91

Der in der Anmeldung formulierte Anspruch 2 sieht für alle im Kodierer ermittelten Parameter eine Quantisierung vor. Dies gilt auch für Signalklassifizierungsparameter, die nach dem Inhalt der Anmeldung aus den genannten Gründen als zu ermittelnde Parameter in Betracht kommen. Vor diesem Hintergrund ist unerheblich, dass diese spezielle Kombination in Figur 5 nicht dargestellt und auch ansonsten nicht ausdrücklich benannt ist.

92

2. Zu Recht hat das Patentgericht entschieden, dass die Erfindung so offenbart ist, dass ein Fachmann sie ausführen kann.

93

Entgegen der Auffassung der Berufung steht dem nicht entgegen, dass das Streitpatent als Beispiel für das Quantisieren der Rahmenklasse nur die bereits erwähnte Darstellung von fünf verschiedenen Klassen mit zwei Bit anführt.

94

Wie bereits oben dargelegt wurde, ist mit dieser Vorgehensweise schon deshalb ein Informationsverlust verbunden, weil die Differenzierung zwischen zwei bestimmten Klassen nur anhand weiterer Informationen möglich ist.

95

Entgegen der Auffassung der Berufung führt diese Vorgehensweise nicht nur dann zu einem Informationsverlust, wenn die für die Rekonstruktion der Information erforderlichen Angaben über den vorangegangenen Rahmen verloren gehen. Bezogen auf einen einzelnen Rahmen liegt ein Informationsverlust schon darin, dass überhaupt auf Daten eines anderen Rahmens zurückgegriffen werden muss.

96

3. Zu Recht hat das Patentgericht entschieden, dass der Gegenstand von Patentanspruch 1 in K3 nicht vorweggenommen ist.

97

a) K3 befasst sich mit der Vorwärts-Fehlerkorrektur (Forward Error Correction, FEC) bei der Übertragung von Audioinformation, insbesondere von sprachkodierter Information (S. 1 Z. 3-6).

98

aa) Nach einer Erläuterung des Kodierverfahrens CELP (S. 1 Z. 12 ff.), des darauf beruhenden Verfahrens für GSM-Mobilfunk (GBM-EFR, S. 4 Z. 7 ff.), des dafür vorgeschlagenen Verfahrens zur Fehlerverschleierung (S. 7 Z. 2 ff.) und eines alternativen, für das US-Militär entwickelten Sprachdekoders (S. 9 Z. 1 ff.) stellt K3 die Vorwärts-Fehlerkorrektur als Möglichkeit zur Behandlung verlorener Pakete vor (S. 10 Z. 9 ff.). Bei FEC würden im Allgemeinen redundante Informationen zusammen mit der kodierten Sprache übertragen. Der Dekodierer versuche, die redundanten Informationen zu nutzen, um verlorene Pakete zu rekonstruieren (S. 10 Z. 15-17).

99

Die nachfolgend wiedergegebene Figur 6 zeige, wie redundante Daten an primäre Daten angehängt werden könnten.

string
100

An die primären Daten jedes Rahmens würden redundante Daten des vorhergehenden Rahmens angefügt. Durch Übertragung zusätzlicher Kopien könnten weitere Redundanzstufen geschaffen werden (S. 11 Z. 17-24).

101

Kodierung und Dekodierung solcher Datenpakete sind schematisch in der nachfolgend wiedergegebenen Figur 5 dargestellt.

string
102

Das Dekodiermodul (504) enthalte eine Logik zur Trennung der primären von den redundanten Daten. Diese würden zwei separaten Dekodierern (512, 514) zugeführt. Der Primärdatenrahmen werde erst dann dekodiert, wenn das nachfolgende Paket mit den redundanten Daten eintreffe. Dies führe zu einer Verzögerung bei der Wiedergabe (S. 12 Z. 5-17).

103

Eine Steuerlogik (518) sorge dafür, dass das vom primären Dekodierer (512) erzeugte Sprachsignal verwendet werde, wenn das Paket mit den Primärdaten empfangen worden sei. Wenn ein Paket mit Primärdaten verloren gehe, diene die Steuerlogik (518) dazu, Lücken im empfangenen Strom mit redundant kodierten Rahmen aufzufüllen (S. 12 Z. 13-19).

104

bb) K3 bezeichnet diese Vorgehensweise als nicht völlig zufriedenstellend.

105

Sprachsynthesemodelle nutzten die Parameter früherer Betriebszustände. Selbst wenn ein Dekodierer fehlende Rahmen mit Hilfe redundanter Daten rekonstruieren könne, sei das "Gedächtnis" des primären Synthesemodells aufgrund des Verlusts von Primärdaten mangelhaft (S. 12 Z. 23 bis S. 13 Z. 5).

106

Darüber hinaus könnten weitere Probleme auftreten. Bei Analyse-durch-Synthese-Verfahren, die lineare Prädiktoren verwenden, könnten Diskontinuitäten der Phasen deutlich hörbar sein. Bei Techniken, die ein adaptives Codebuch verwendeten, könne ein Phasenfehler in der Rückkoppelungsschleife für zahlreiche Rahmen bestehen bleiben. Bei Sprachkodierern, die LP-Koeffizienten (LPC) verwendeten, die bei der Kodierung vorhergesagt würden, verringere ein Verlust des LPC-Parameters die Genauigkeit des Prädiktors (S. 13 Z. 6-13).

107

cc) Zur Verbesserung schlägt K3 eine weitergehende "Interaktion" zwischen dem primären und dem redundanten Synthesemodell (S. 13 Z. 27-30) und eine vorausschauende Verarbeitung im Kodier- und Dekodiermodul (S. 14 Z. 1-6) vor.

108

Ein dafür geeignetes System ist schematisch in der nachfolgend wiedergegebenen Figur 7 dargestellt.

string
109

Um das Problem einer fehlenden Aktualisierung des "Gedächtnisses" des primären Synthesemodells zu lösen, würden bei Bedarf Informationen aus dem redundanten Synthesemodell zur Aktualisierung des Zustands des primären Synthesemodells eingesetzt. In ähnlicher Weise könne das Dekodiermodul (704) "Gedächtnis"-Mängel im redundanten Synthesemodell beheben, indem es parametrische Informationen aus dem primären Synthesemodell verwende (S. 17 Z. 18-25).

110

Welche Strategie zur Aktualisierung verwendet werde, hänge von den Anforderungen der Modelle ab. Einige Modelle könnten eine stärkere Abhängigkeit von früheren Zuständen aufweisen als andere. Dies hänge auch von den vorherrschenden Fehlerbedingungen im Dekodiermodul (704) ab. Diese seien gekennzeichnet durch die Strategie, die im vorherigen Rahmen zur Dekodierung der Sprache verwendet worden sei (z.B. primär, redundant, Fehlerverschleierung), durch die Verfügbarkeit von Daten im aktuellen Rahmen (z.B. primär oder redundant) und durch den Empfang oder Nichtempfang des nächsten Rahmens. Dementsprechend definierten die Dekodieranweisungen, die jedem Zustand zugeordnet seien und die spezifisch für die Fehlerbedingungen seien, vorzugsweise auch die Methode zur Aktualisierung der Synthesemodelle (S. 17 Z. 28 bis S. 18 Z. 8).

111

Das Dekodiermodul (704) könne die Verzögerung zwischen Empfang und Dekodieren der primären Daten nutzen, um die primären Daten für vorgelagerte Prozesse zur Qualitätsverbesserung zu nutzen. Wenn etwa ein Rahmen n verlorengegangen sei und dessen Daten anhand der redundanten Daten im nachfolgenden Rahmen n+1 dekodiert würden, könnten die primären Daten dieses Rahmens eingesetzt werden, um durch Interpolation der Energiewerte einen sanfteren Übergang zwischen den beiden Rahmen zu ermöglichen (S. 19 Z. 9-23).

112

Das Kodiermodul (702) könne die ohnehin auftretende Verzögerung dazu nutzen, die primären Daten eines Rahmens n und die redundanten Daten des vorhergehenden Rahmens n-1 zur gleichen Zeit zu kodieren. Dies eröffne die Möglichkeit zu einer vorausschauenden Verarbeitung (S. 19 Z. 25 bis S. 20 Z. 9).

113

Die Tonhöhenphase (pitch phase, pitch pulse phase, pitch pulse position) könne nützliche Informationen zur Fehlerkorrektur enthalten. Um dies auszunutzen, könne das Dekodiermodul (704) die Position des Tonhöhenpulses durch Auffinden der Korrelationsspitzen bestimmen (S. 20 Z. 19-24). Ferner könne das Kodiermodul (702) Informationen über die Tonhöhenphase des ursprünglichen Sprachsignals (z.B. Position und Vorzeichen des Tonhöhenpulses) bestimmen und in der redundanten Kodierung übertragen (S. 21 Z. 6-9).

114

dd) Ein alternatives Kodiermodul ist schematisch in der nachfolgend wiedergegebenen Figur 8 dargestellt.

string
115

Ein Extraktor (804) extrahiere parametrische Informationen aus dem primären Kodierer (802). Diese würden durch ein Modul (806) um einen Rahmen verzögert. Der Extraktor (804) wähle eine Teilmenge aus den primär kodierten Parametern aus. Die extrahierten Parameter könnten in ein anderes Format konvertiert werden, um sie mit reduzierter Bandbreite darzustellen, zum Beispiel durch Quantisieren mit einer Methode, die weniger Bits erfordere (S. 22 Z.12-28).

116

ee) Bei einem in K3 geschilderten Ausführungsbeispiel werden ein als GSM-VOC vocoder bezeichneter Kodierer und ein als GSM-VOC decoder bezeichneter Dekodierer eingesetzt.

117

Der Dekodierer weise eine Funktion zum Anlegen eines Anregungssignals auf, das entweder einen Rauschvektor (für stimmlose Laute) oder eine statische Pulsform (für stimmhafte Sprache) umfasse.

118

Der Kodierer teile eingehende Sprache in Rahmen von 20 ms auf und berechne das quadratische Mittel (root mean square, RMS) der Energie. Danach berechne und quantifiziere er einen einzigen Satz von LP-Koeffizienten nach der im GSM-EFR-Standard festgelegten Methode (S. 23 Z. 30 bis S. 24 Z. 5).

119

Anschließend führe der Kodierer eine Open-Loop-Tonhöhensuche für jede Hälfte eines Rahmens durch (S. 24 Z. 9 f.). Die Stimmhaftigkeit berechne er auf der Grundlage der ungewichteten maximalen Korrelation aus der Open-Loop-Suche. Dabei vergleiche er den aktuellen Halbrahmen mit den beiden vorangehenden und den beiden nachfolgenden Halbrahmen. Da bei der Verarbeitung eines Rahmens bereits Daten für den nächsten Rahmen zur Verfügung stünden, sei dies nicht mit zusätzlichen Verzögerungen verbunden (S. 24 Z. 21-30).

120

Um zu bestimmen, ob Sprache stimmhaft sei, vergleiche der Kodierer die fünf angezeigten Korrelationen mit drei verschiedenen Schwellenwerten. Anhand des ersten Vergleichs könne er schnell auf den Beginn eines stimmhaften Segments reagieren. Der zweite Schwellenwert werde zur Erkennung von Stimmhaftigkeit während eines stimmhaften Abschnitts verwendet. Wenn der vorherige Halbrahmen stimmhaft gewesen sei, werde der dritte Schwellenwert herangezogen, um sicherzustellen, dass der Kodierer den Halbrahmenbereich, in dem der Übergang von stimmhafter zu stimmloser Sprache stattfinde, als stimmhaft markiere. Die an den Dekodierer gesendeten Informationen enthielten die auf diese Weise berechnete Stimmhaftigkeit für beide Halbrahmen (S. 25 Z. 3-18).

121

ff) Der Dekodierer erzeuge einen Erregungsvektor aus der Bestimmung der Stimmhaftigkeit (voicing) und aus der Tonhöhe. Die Stimmhaftigkeit umfasse zwei stationäre Zustände (voiced, unvoiced) und zwei Übergangszustände (unvoiced to voiced, voiced to unvoiced). Die Übergangszustände träten in beiden Hälften der Rahmen auf und definierten somit vier verschiedene Zustände (S. 27 Z. 3-9).

122

Das Dekodiermodul bilde die Erregung durch Summierung zweier Vektoren und passe die Amplitude des Erregungsvektors mit einem RMS-Wert für jeden Subrahmen an. Eine Anpassung auf Subrahmen-Basis stelle jedoch möglicherweise nicht die beste Option dar, da die Energieverteilung der Tonhöhenimpulse nicht gleichmäßig sei. Stattdessen könne eine Anpassung auf Basis eines Tonhöhenimpulses erfolgen. Dies erfolge durch Interpolation zwischen mehreren Effektivwerten (S. 30 Z. 25 bis S. 31 Z. 7).

123

Im Zusammenhang mit möglichen Abwandlungen führt K3 ergänzend aus, die RMS-Messung im letzten Subrahmen könne so geändert werden, dass die letzte vollständige Tonhöhen-Epoche, und damit nur ein Tonhöhenimpuls gemessen werde. Bei der aktuellen Messung über den letzten Subrahmen könnten je nach Position des Pulses und der Tonhöhenverzögerung null, ein oder zwei hochenergetische Teile vorhanden sein. Eine ähnliche Modifikation sei für die Energieverteilung im Zustand "Red Single Error" und den stationären stimmhaften Zustand möglich. In diesen Fällen könne die Energieinterpolation in Abhängigkeit von der Anzahl der Tonhöhenimpulse angepasst werden (S. 36 Z. 9-16).

124

gg) Als weitere Abwandlungsmöglichkeit führt K3 an, einige Parameter könnten weggelassen werden, um die Menge an redundanten Daten zu reduzieren. So könnten für stimmlose Sprache die in der nachfolgend wiedergegebenen Tabelle 2 aufgeführten Parameter verwendet werden. Hierbei könne der Parameter "voicing state" entfallen und stattdessen die Datenmenge als Indikator für stimmlose Sprache herangezogen werden (S. 37 Z. 9-16).

string
125

b) Damit sind die Merkmale 1, 2, 4, 5 und 6 offenbart.

126

Entgegen der Auffassung der Berufungserwiderung ist in K3 eine Übertragung an den Dekodierer auch für die Information über die Stimmhaftigkeit eines Rahmens offenbart. Dies ergibt sich aus der oben wiedergegebenen Tabelle 2, die hierfür zwei Bit vorsieht.

127

c) K3 offenbart das Ermitteln von Informationen zur Energie, zur Stimmhaftigkeit und zur Phase. Mit der Korrelation zwischen mehreren Halbrahmen wird ferner ein Signalklassifizierungsparameter ermittelt. Diese Werte werden in K3 zur Klassifizierung eines Halbrahmens als stimmhaft oder stimmlos herangezogen.

128

Es kann zugunsten der Klägerin unterstellt werden, dass damit auch Merkmal 3.1 offenbart ist.

129

d) Nicht vollständig offenbart ist jedenfalls Merkmal 3.2.

130

aa) Entgegen der Auffassung der Berufung ist dieses Merkmal für die Beurteilung der Patentfähigkeit relevant. Wie bereits oben dargelegt wurde, kommt ihm technische Natur zu.

131

bb) Wie die Berufungserwiderung zu Recht geltend macht, ist die Unterscheidung zwischen sechs verschiedenen Zuständen in K3 nur für den Dekodierer offenbart. Für den Kodierer wird hingegen nur eine Unterscheidung zwischen "voiced" und "unvoiced" geschildert.

132

e) Ebenfalls nicht vollständig offenbart ist die Merkmalsgruppe 3.3.

133

aa) Wie bereits oben dargelegt wurde, sieht K3 als übliche Methode zur Ermittlung von Informationen über die Energie die Berechnung eines quadratischen Mittelwerts (RMS) vor.

134

Dies entspricht der Vorgabe aus Merkmal 3.3.2.

135

bb) Nicht offenbart ist hingegen die Berechnung eines Maximalwerts im Sinne von Merkmal 3.3.1.

136

(1) Entgegen der Auffassung der Berufung ist Merkmal 3.3.1 durch die in K3 enthaltenen Ausführungen zur Berechnung eines Mittelwerts nicht offenbart.

137

Wie bereits oben dargelegt wurde, ergibt sich aus der Formulierung "in relation to" nicht, dass die Berechnung eines Mittelwerts als Berechnung in Relation zu einem Maximalwert angesehen werden kann.

138

Entgegen der Auffassung der Berufung reicht die Festlegung einer unteren Summationsgrenze und einer oberen Summationsgrenze für die RMS-Berechnung für die Verwirklichung von Merkmal 3.3.1 ebenfalls nicht aus.

139

(2) Entgegen der Auffassung der Berufung führt die in K3 aufgezeigte Variante, für stimmhafte Varianten nur die letzte vollständige Tonhöhen-Epoche, also nur einen Tonhöhenimpuls zu messen, ebenfalls nicht zur Berechnung in Relation zu einem Maximum.

140

(a) Wie auch die Berufung nicht in Zweifel zieht, wird auch bei dieser Variante ein Durchschnittswert berechnet. Dass hierfür ein kleinerer Messbereich herangezogen wird, ist unerheblich.

141

(b) Aus dem von der Berufung angeführten Umstand, dass der RMS-Wert (im Deutschen auch Effektivwert genannt) und der Maximalwert (im Deutschen auch Scheitelwert genannt) bei einfachen periodischen Wellen in einem festen Verhältnis zueinander stehen, ergibt sich keine abweichende Beurteilung.

142

Diesem Umstand käme allenfalls dann Bedeutung zu, wenn zu erwarten wäre, dass die in K3 untersuchten Impulse jedenfalls typischerweise die Form einer periodischen Welle haben. Letzteres ist nach den Feststellungen des Patentgerichts indes nicht der Fall. Konkrete Anhaltspunkte, die Zweifel an der Vollständigkeit oder Richtigkeit dieser Feststellung begründen, sind weder aufgezeigt noch sonst ersichtlich.

143

Für die in K3 vorgeschlagene Variante, bei der nur eine einzelne Impulsperiode (Pitch-Periode) untersucht wird, ergibt sich keine abweichende Beurteilung. Wie die Berufungserwiderung zu Recht geltend macht, ergibt sich aus der nachfolgend wiedergegebenen Figur 3.1 der Entgegenhaltung K4, die die Klägerin mit Markierungen zur Länge eines Tonhöhenimpulses ergänzt hat, dass bei Sprachsignalen auch ein einzelner Pitch-Puls keine Form aufweist, die es ermöglicht, aus dem Effektivwert Rückschlüsse auf den Scheitelwert zu ziehen.

string
144

(c) Der von der Berufung geltend gemachte Umstand, dass es bei bekannter Form im Ermessen des Fachmanns liegt, ob er den Effektivwert oder den Scheitelwert heranzieht, führt ebenfalls nicht zu einer abweichenden Beurteilung.

145

Dieser Umstand vermag eine unmittelbare Offenbarung von Merkmal 3.3.1 in K3 schon deshalb nicht zu begründen, weil sich die genannte Erkenntnis nicht allein aus den Darlegungen in K3 ergibt, sondern allenfalls aus einer ergänzenden Heranziehung von Fachwissen.

146

4. Ebenfalls zutreffend ist das Patentgericht zu dem Ergebnis gelangt, dass der Gegenstand von Patentanspruch 1 auf einer erfinderischen Tätigkeit beruht.

147

a) Aus K3 ergeben sich keine Anregungen in Richtung auf die geschützte Lehre.

148

K3 gibt jedenfalls keine Anregung oder Hinweise, die Frage, ob zur Ermittlung des Energieinformationsparameters der Effektivwert oder der Scheitelwert als Ausgangswert der Berechnung ermittelt wird, von der Rahmenklasse abhängig zu machen.

149

K3 unterscheidet zwar zwischen einzelnen Rahmenklassen, sieht jedoch für jede Rahmenklasse eine Berechnung des quadratischen Mittelwerts (RMS) der Energie und damit die Ermittlung des Effektivwerts vor. Dies gilt auch für die Variante, bei der nur die letzte vollständige Tonhöhen-Epoche gemessen wird.

150

Dass für die Wahl des Erfassungsbereichs der Rahmenklasse eine Bedeutung zukommen kann, gibt keine Veranlassung, für eine bestimmte Rahmenklasse von der in K3 für alle Klassen vorgesehenen Berechnung des quadratischen Mittels abzuweichen und diese nur für diese Rahmenklasse durch eine Berechnung in Relation zu einem Maximum der Signalenergie (Scheitelwert) zu ersetzen.

151

b) Diesbezügliche Anregungen ergaben sich auch nicht aus dem allgemeinen Fachwissen.

152

aa) Aus den von der Berufung aufgezeigten Zusammenhängen zwischen Effektiv- und Scheitelwert ergibt sich nicht die Anregung, die Berechnung der Energie von der Klassifizierung des Rahmens abhängig zu machen.

153

bb) In der Veröffentlichung der U.S. Environmental Protection Agency (About sound, Washington D.C., Mai 1976, K7) wird unter dem Stichwort "Root mean-square" (S. 40) zwar ausgeführt, der RMS-Wert sei am besten für gleichmäßigen Schall geeignet, während der Spitzenwert für die Beurteilung von impulsartigem Schall notwendig sei. Daraus ergeben sich aber keine Hinweise darauf, dass dieser Unterschied auch für die Kodierung und Dekodierung von Sprachsignalen nach dem Vorbild von K3 von Bedeutung sein kann.

154

5. Hinsichtlich der Ansprüche 39, 54, 75, 90 und 91 ergibt sich keine abweichende Beurteilung.

155

Alle diese Ansprüche sehen das Merkmal 3.3 vor.

156

IV. Die Kostenentscheidung beruht auf § 121 Abs. 2 PatG und § 97 Abs. 1 ZPO.

Bacher

Hoffmann

Kober-Dehm

Marx

Rombach

Von Rechts wegen

Verkündet am: 16. Januar 2024

Hinweis: Das Dokument wurde redaktionell aufgearbeitet und unterliegt in dieser Form einem besonderen urheberrechtlichen Schutz. Eine Nutzung über die Vertragsbedingungen der Nutzungsvereinbarung hinaus - insbesondere eine gewerbliche Weiterverarbeitung außerhalb der Grenzen der Vertragsbedingungen - ist nicht gestattet.