Har fått en Voice Preview boks i hus og begynt å leke litt.
Home Assistant Cloud integrasjonen + ChatGPT integrasjon gjør at den lar seg ganske greit prate norsk med gitt at man har eksponert riktige entiteter. Litt hikke er det som at den legger opp til oppfølgingsinteraksjoner - noe som ikke er mulig såvidt jeg har skjønt. Så hvis jeg ber den om å spille musikk så kan jeg ikke svare på om det skal gjøres på bad eller kjøkken - sånn sett burde jeg vært eksplisitt - eller den skulle bare antatt at jeg ville spille på begge.
På sikt er jo målet at hele pipen skal kjøre lokalt, men foreløpig går ting såpass fort på AI-fronten (og hva man synes om det hele er en lang diskusjon for en annen gang ...) at jeg ikke finner det interessant eller hensiktsmessig å spinne opp noe med nok hardware til å tilfredsstillende kjøre en lokal modell av noe. ChatGPT (eller ekvivalent) integrasjon er derfor en kamel jeg er villig til å svelge for nå. Det jeg derimot ser som mer nærliggende å komme meg bort ifra er Home Assistant Cloud og over på en Whisper/Piper stack for tale-til-tekst og tekst-til-tale. Siden jeg kjører Home Assistant i Docker og ikke VM er det ikke helt plug&play på akkurat den fronten så tenkte å utforske litt - eventuelt bite i det sure eplet og dytte Home Assistant inn i en VM med HAOS.
Tenkte vi kunne ha en tråd der vi utvekslet erfaringer rundt en norskfokusert stemmestyring av Home Assistant. Et par punkter det hadde vært kult om noen har erfaringer med eller har gjort seg noen tanker om:
Erfaringer med å spinne opp Whisper med norsk modell (har sett denne modellen som virker aktuell)
Lokale alternativ til ChatGPT, hardware med akseptabel ytelse mm.
Noen som har laget seg helnorske "wake words"?