Run LLM Locally on Your PC!
45sShows how to set up a local LLM on a regular Windows PC without extra hardware, appealing to budget-conscious Home Assistant users.
▶ Play ClipThis video demonstrates how to install Ollama on a Windows PC and integrate it with Home Assistant to run a local LLM without needing a dedicated server. The setup allows using the LLM for AI tasks, conversational agents, and LLM Vision within Home Assistant.
Shows how to install Ollama on an existing Windows PC and integrate it with Home Assistant for local LLM use.
Many Home Assistant users lack a spare PC with a modern GPU; this setup uses a regular Windows PC.
RTX 460 Ti (8GB VRAM), AMD Ryzen 5 7600X, 64GB RAM, 2TB NVMe SSD.
Go to ollama.com, select Windows download, and install the application.
After installation, the Ollama UI opens. Model Gemma 3 is chosen (4B variant) for its vision support.
Sending a message triggers automatic model download; after download, chat works.
Gemma 3 supports vision, but first use may show an error; restarting Ollama fixes it.
Use `ollama help` for commands, `ollama list` to see installed models, `ollama run <model>` to start.
Specify exact variant (e.g., `ollama run gemma3:4b`) to avoid downloading a heavier default version.
Enable 'Allow Ollama to access network' in settings to make it accessible to Home Assistant.
Add Ollama integration via Settings > Devices & Services > Add Integration > Ollama, using the local IP and port.
Create an AI task and a conversation agent in Home Assistant, selecting the installed model (Gemma 3 4B).
Add Ollama as a provider in LLM Vision (if installed) using the same IP and model.
In Home Assistant Voice Assistant settings, select the Ollama conversation agent created earlier.
Demonstrates using LLM Vision and AI task actions with Ollama, analyzing a camera image.
Running the same action with OpenAI shows similar speed but slightly more detailed analysis.
This setup allows running a local LLM on a Windows PC integrated with Home Assistant for AI tasks, conversational agents, and vision analysis, without extra hardware costs.
"The title accurately describes the content: a guide to setting up Ollama on Windows and integrating it with Home Assistant for local LLM use."
What is the main purpose of this video?
To show how to install Ollama on a Windows PC and integrate it with Home Assistant for local LLM use.
What hardware does the presenter use?
RTX 460 Ti (8GB VRAM), AMD Ryzen 5 7600X, 64GB RAM, 2TB NVMe SSD.
1:20
Which model is used in the video and why?
Gemma 3 (4B variant) because it supports vision.
3:33
What should you do if the model does not support images after first download?
Restart Ollama.
4:51
How do you list installed models via command line?
Use `ollama list`.
6:38
What command runs a specific model variant?
`ollama run <model>:<variant>` (e.g., `ollama run gemma3:4b`).
7:59
What setting must be enabled in Ollama for Home Assistant to access it?
Allow Ollama to access network.
10:52
How do you add Ollama integration in Home Assistant?
Go to Settings > Devices & Services > Add Integration > Ollama, enter the local IP and port.
11:41
What two components can be created in Home Assistant using Ollama?
AI task and conversation agent.
12:15
How do you test Ollama with an image in Home Assistant?
Use an action with LLM Vision or AI task, selecting Ollama as provider and an image entity.
15:39
No Spare PC Needed
Highlights that a dedicated server is not required, making local LLM accessible to most users.
0:51Model Variant Selection
Explains the importance of choosing the right model variant (e.g., 4B) for performance and resource balance.
3:33Network Access Enablement
Critical step to allow Home Assistant to communicate with Ollama; often overlooked.
10:46Dual Integration
Shows how to create both an AI task and a conversation agent, expanding use cases.
12:15Local vs Cloud Comparison
Demonstrates that local Ollama performs comparably to OpenAI in speed, with slightly less detail.
18:32[00:00] Ahoj, tady Dave. V tomto videu vám ukážu, jak nainstalovat Ollamu
[00:05] na váš stávající počítač s Windows, který už používáte každý den, a integrovat ji
[00:10] do Home Assistant, abyste si mohli doma spustit lokální LLM. K tomu nepotřebujete
[00:16] náhradní počítač ani specializovaný Linuxový server. Použijeme pouze váš běžný
[00:22] počítač a zpřístupníme ho Home Assistant ve vaší síti. Jakmile ho nastavíte
[00:27] , budete ho moci používat s věcmi, jako jsou úlohy s umělou inteligencí, konverzační agenti a
[00:32] dokonce i LLM Vision. Začneme instalací Ollamy, poté ji připojíme k Home Assistant
[00:39] a nakonec ukážu několik rychlých příkladů, abych se ujistil, že vše
[00:43] funguje.
[00:51] Důvod, proč tohle video dělám, je ten, že nemám
[00:56] k dispozici náhradní počítač s moderní grafickou kartou, který by fungoval jako specializovaný LMM server. A jak vím, spousta
[01:03] uživatelů Home Assistant je na tom úplně stejně. Většina lidí nemá
[01:08] volné 2, 3 nebo dokonce 4 000 liber nebo dolarů na sestavení
[01:14] špičkového stroje s umělou inteligencí. Jen abyste věděli, tohle používám na svém běžném
[01:20] počítači s Windows. Mám RTX 460 Ti s 8 GB VRAM, AMD Ryzen 5
[01:28] 7600X, 64 GB RAM a 2 terabajtový NVMe SSD.
[01:35] Nic moc extrémního, jen herní nebo pracovní stanice střední třídy. A pokud
[01:41] bude dostatečná poptávka, můžu tento počítač dočasně považovat za náhradní stroj,
[01:46] nainstalovat na něj Linux a natočit samostatné video, které ukazuje, jak nainstalovat
[01:52] Ollamu v linuxovém prostředí a spustit ji jako samostatný stroj s LMM.
[01:58] Toto video je určeno pro běžné uživatele Home Assistant, kteří chtějí
[02:03] experimentovat s alarmem nebo lokálními LMM, aniž by utratili jakékoli peníze navíc. Jediné,
[02:10] co je třeba mít na paměti, je, že váš počítač s Windows bude muset zůstat zapnutý,
[02:14] zatímco ho Home Assistant používá. Takže v závislosti na vašem nastavení to nemusí být
[02:20] ideální pro každého, ale pro většinu lidí je to skvělý způsob, jak začít a
[02:26] zjistit, co je možné. Dobře, přepněme na můj počítač a stáhneme
[02:30] si Alamu. Chcete-li nainstalovat Ollamu, přejděte na
[02:35] následující webovou stránku, která vám nabídne
[02:39] výběr operačního systému. Máte tedy Windows, Mac nebo Linux a
[02:44] zobrazí se vám instalační příkaz. V tomto příkladu používám Windows. Vyberu tedy
[02:49] stažení pro Windows.
[02:56] Po dokončení stahování přejděte do složky se staženými soubory a nainstalujeme
[02:59] Ollamu.
[03:04] Spustím ji jako správce, pro případ, že by potřebovala další
[03:09] zvýšená práva. Pokud kliknete na tlačítko Instalovat,
[03:18] po dokončení instalace by se mělo zobrazit vyskakovací okno uživatelského
[03:22] rozhraní Ollamy, podobné tomuto, kde můžete začít chatovat. Zde máte seznam
[03:28] dostupných modelů. Model, který v tomto příkladu použiji, bude
[03:33] Gemma 3, protože podporuje vizuální komunikaci.
[03:37] Všimněte si, že dvojtečka „gem free“ má číslo s písmenem B,
[03:42] které označuje miliardu obvodů. Čím vyšší číslo, tím
[03:46] přesnější bude, ale také to bude spotřebovávat více zdrojů. Takže
[03:51] tu střední třídu nechám, protože funguje docela dobře a je
[03:55] poměrně lehká. A pokud byste potřebovali nainstalovat další
[03:59] model, můžete sem prostě najet myší, kliknout na tlačítko pro stažení a počkat
[04:03] , až se nainstaluje. Momentálně jsem
[04:07] si ještě žádný nestáhl. Takže kdybych napsal zprávu, dostal bych nějakou
[04:12] výzvu ke stažení modelu. Takže vám ukážu, co
[04:16] se stane, když to udělám poprvé. Takže prostě kliknu na Odeslat.
[04:22] A vidíte, že se model stahuje.
[04:28] A jakmile se nainstaluje, chat začne fungovat.
[04:35] Z nějakého důvodu se při pokusu o nahrání obrázku zobrazí zpráva jako je
[04:40] ta níže, kde se píše, že tento model nepodporuje obrázky. A v tomto příkladu
[04:45] můžu na 100 % říct, že Gemma 3 podporuje vidění. Možná budete muset
[04:51] restartovat Ollamu, protože model instalujeme poprvé a myslím,
[04:55] že se trochu zmátl a nenačetl se správně,
[04:58] aby rozpoznal, že podporuje vidění. Takže zavřete Alarmu
[05:03] , znovu ji otevřete a já to ukážu na příkladu obrázku.
[05:10] Chcete-li Ollamu zavřít, klikněte zde na X a poté ji restartujte, pokud...
[05:15] Klikněte na tuto šipku nahoru, najeďte myší na Ollamu a poté vyberte "Otevřít Ollamu".
[05:22] Teď, když je to zase otevřené, přiložím obrázek a požádám ho o
[05:26] popis. Toto je kopie ukázkového obrázku, abyste
[05:31] si ho mohli prohlédnout, než se zeptám.
[05:38] Teď kliknu na Enter.
[05:48] Vidíte, že mi to poskytlo pěkný přehled, že obrázek ukazuje
[05:52] částečný pohled na moderní světlou kuchyň. A pak jsou uvedeny některé
[05:57] prvky, které jsou skutečně viditelné. Takže víme, že to funguje.
[06:02] Teď vám ukážu několik příkladů, jak používat alarm pomocí příkazového řádku.
[06:09] Takže z vyhledávání ve Windows zadáte cmd/launch command prompt a teď,
[06:15] když zadáte Ollama
[06:19] a pak za konec přidáte help, zobrazí se vám seznam různých
[06:26] dostupných příkazů, které můžete použít. Pokud jen vymažu obrazovku
[06:32] a spustím Ollama list,
[06:38] zobrazí se vám modely, které již máme nainstalované, které mají
[06:42] Gemma 3 a 4 miliardy obvodů. Takže pokud to chcete spustit,
[06:48] stačí zadat „run“ a za ním název.
[06:58] Pokud chcete zobrazit seznam různých dostupných modelů, které si můžete
[07:02] stáhnout a nainstalovat, jděte na ollama.com
[07:10] a vyberte
[07:15] zde modely, zobrazí se vám seznam různých modelů, které můžete
[07:18] vyhledat nebo je vyhledat. Pokud tedy vyhledám „Gemma“, uvidíte
[07:25] různé modely. A když kliknu na ten horní
[07:30] , uvidíte příkaz „run“ pro použití Gemmy 3. A je tam seznam dalších
[07:35] různých variant. Pokud se vrátím o krok zpět,
[07:42] když znovu kliknu na tento, máte příkaz „run“
[07:50] a seznam variant. Takže když zadáte „run“, stačí
[07:55] zadat název, který chcete nainstalovat.
[07:59] Jen pro upřesnění, když spustíte „llama run“ a nezadáte konkrétní
[08:04] model z tohoto seznamu. Například když spustíte „lama run gpt oss“, nainstaluje se
[08:13] výchozí verze, kterou je tato. Takže si dávejte
[08:18] pozor, možná budete chtít o něco lehčí model. A pokud je to váš
[08:23] případ, ujistěte se, že spustíte příkaz alarm run a poté slovo od slova specifikujete,
[08:29] jakou variantu daného modelu skutečně chcete. Jako příklad tedy zkopíruji
[08:34] tento příkaz a vrátím se do příkazového řádku. Ukončím
[08:38] stávající chat stisknutím klávesy C a poté ctrl+
[08:44] D.
[08:51] A v tomto příkladu vidíte, že protože to ještě nemám nainstalované,
[08:55] automaticky se stáhne a poté se to spustí.
[09:01] Dobře, zrušme tento chat. Vyčistěte obrazovku a já spustím
[09:07] Gemmu 3 a požádám ji o popis obrázku z příkazového řádku. Pokud
[09:15] zapomenete, které modely již máte nainstalované,
[09:18] jen připomínám, že je to ollama list a poté ollama run. A já jen zadám
[09:24] danou gemmu
[09:27] přesně tak, jak je uvedena.
[09:34] Protože je vzorový obrázek, který používám, na tomto místě, kliknu
[09:40] pravým tlačítkem myši a zobrazí se další možnosti. Vyberte vlastnosti
[09:45] a poté z zabezpečení zkopíruji název souboru a cestu,
[09:52] pak se vrátím do příkazu a napíšu následující
[09:58] příkaz: use. Vložte do adresáře, kde se soubor
[10:02] nachází. Pokud název souboru obsahoval mezery, řekněme, že se jednalo o kuchyňský
[10:08] prostor, jako je tento. Pokud přidáte uvozovky, vyřeší to problém
[10:12] s nenalezením názvu souboru. Ale v této ukázce nejsou žádné prázdné
[10:17] mezery, takže to nemusím dělat. Takže jsem napsal use, uveďte cestu
[10:22] a zeptám se na něco.
[10:29] Můžete popsat obrázek? Stiskněte Enter. A mělo by se zobrazit podobný výsledek, jako
[10:35] když jsem používal uživatelské rozhraní,
[10:40] což má. Takže to vypadá dobře. Těsně před integrací do Home
[10:46] Assistant ho musíme zpřístupnit síti.
[10:52] Pokud kliknete na šipku nahoru a kliknete pravým tlačítkem myši na Ollama a provedete nastavení,
[11:00] ujistěte se, že jste zaškrtli toto políčko, zpřístupnit Alarm síti. Pokud
[11:06] to neuděláte, pak následující IP adresa následovaná tímto
[11:11] portem vygeneruje chybovou zprávu podobnou této, která říká, že tento
[11:15] web není dostupný. Prostě to zpřístupním zaškrtnutím tohoto políčka.
[11:22] Pokud tuto stránku aktualizuji, mělo by to fungovat.
[11:26] Vlevo nahoře vidíte, že je spuštěný alarm.
[11:31] Dobře. Teď, když Ollama běží a máme ji síti, přejděme
[11:36] na Home Assistant a začneme s integrací.
[11:41] V Home Assistant přejděte do nastavení,
[11:44] poté do zařízení a služeb, klikněte na přidat integraci
[11:51] , vyhledejte Olama
[11:55] a vyberte tu první. Toto je URL adresa, kterou jsem zobrazoval dříve,
[12:02] když se psalo, že Ollama běží. Takže ji tam vložím. Pak vyberu
[12:08] odeslat. Vidíte, že je to úspěšné.
[12:15] Odtud můžu přidat konverzačního agenta a můžu přidat
[12:21] úlohu AI. Vyberu přidat úlohu AI
[12:26] a na konec vložím Ollamu.
[12:32] A co se týče modelu, musí to být jeden z modelů, které jsem nainstaloval.
[12:39] Zde vidíte, že máte staženou Gemmu 3 4B.
[12:43] Takže ji vybereme. Zbytek nastavení v podstatě ponechám
[12:48] jako výchozí. A teď kliknu na Odeslat.
[12:54] To vypadá dobře. Když už jsem tady, mohl bych stejně tak přidat
[12:59] konverzačního agenta pro ty z vás, kteří používají hlasový asistent pro domácnost. Znovu změním
[13:05] model na ten, který je již stažen.
[13:09] Všechno nechám jako výchozí. Zaškrtnu políčko u asistence
[13:17] a pak kliknu na Odeslat.
[13:21] Takže teď jsme přidali konverzační agenty a úlohy AI, které budou používat
[13:27] Olamu, a teď ji jen rychle integrujeme do LMM Vision pro
[13:33] ty z vás, kteří ji mají nainstalovanou. Ještě jsem nenatočil celé video o LMM Vision
[13:39] , ale brzy vyjde a jakmile bude venku, dám
[13:44] vám odkaz do popisu. Takže pokud půjdeme do nastavení,
[13:52] zařízení a služeb. Pokud teď jen vyhledáme LMM Vision,
[14:00] předpokládám, že ji už máte nainstalovanou a možná máte Open AI
[14:04] jako jednu z existujících položek. Nyní vybereme Přidat položku.
[14:11] Změňte ji na Ollama. Klikněte na Odeslat.
[14:17] IP adresa je opět ta, kterou jsem ukázal dříve
[14:24] , a to je jen bez podpory, protože je již uvedena níže. Ujistěte se, že
[14:28] model je ten, který jste již nainstalovali. Gemma 3 je jeden z
[14:33] modelů, který podporuje Vision. Takže to je perfektní volba.
[14:38] Pak už jen kliknu na Odeslat. A teď jsme ho přidali i do LMM Vision
[14:46] . Chcete-li nyní používat Ollamu s
[14:51] hlasem domácího asistenta, přejděte do nastavení a poté na hlasového asistenta.
[14:58] A pokud vyberete Přidat asistenta
[15:04] a v části Konverzační agent byste měli vidět toho, co jsem vytvořil, a to je
[15:10] konverzace Ollama, kterou byste zde vybrali. Nechci zacházet do přílišných
[15:16] detailů ohledně těchto nastavení, pokud jde o přidání asistenta, protože když jsem točil
[15:21] video s hlasem domácího asistenta, už jsem to podrobně probral. Účelem
[15:27] tohoto videa je vlastně jen integrace alarmu do Home Assistant
[15:32] , abyste ho mohli využít. Takže toto okno zavřu. Nyní vytvořím
[15:39] dvě akce. Jednu akci s využitím LLM Vision s Ollamou a také úlohu s umělou inteligencí
[15:49] , která používá Ollamu. Pokud přejdete do nástrojů pro vývojáře
[15:55] a na kartu Akce, tak vymažu tu obrazovku a já
[16:01] to přepnu do režimu uživatelského rozhraní, protože je to trochu snazší vysvětlit. Takže
[16:05] zadám llm a použijeme analyzátor obrazu.
[16:12] Poskytovatelem bude tento alarm, který jsem přidal. Nechám to
[16:18] tak, jak je. Takže výchozí by byla Gemma 3. Jako výzvu se zeptám
[16:23] : „Co vidíte?“
[16:28] Zruším zaškrtnutí těchto dvou políček. Nechci si to pamatovat ani používat paměť. A jen
[16:33] velmi rychle použiji obrazovou entitu jednoho z mých fotoaparátů.
[16:38] Mám tu jeden z kuchyně. Zbytek nechám jako výchozí nastavení.
[16:44] Jen se musím ujistit, že jsem zaškrtl políčko „vložit soubor“, jinak to nebude fungovat.
[16:49] Teď vyberu provést akci.
[17:02] A vidíte, že mi to poskytlo nějaké podrobnosti o daném obrázku. A to je
[17:08] ten obrázek, na který se to vztahuje. Takže to funguje. Teď budeme v podstatě
[17:13] opakovat přesně ty samé kroky, ale jako úlohu s umělou inteligencí. Takže když se vrátím nahoru, zadám
[17:21] AI a použiji funkci generování dat,
[17:28] což je tento tady. Název úkolu mu prostě budu říkat
[17:33] demo. Je jedno, jak ho pojmenuji. Pokyny,
[17:37] udělám to úplně stejně. Co vidíte? ID entity je poskytovatel
[17:44] a je to tady, Ollama AI tasky.
[17:49] A pak příloha. Vyberu si mediální soubor. Přejdu
[17:54] na kameru a použiji tu kuchyň. Takže je to stejný obrázek.
[18:00] A teď vyberu provést akci. Už to ukazuje
[18:05] předchozí akci, ale mělo by to být trochu jiné. Takže když
[18:09] na to kliknu, jen počkejte, až to spustí své procesy.
[18:16] A vidíte, že to je hotové. Má to... Dobře, pojďme si rozebrat, co vidím
[18:21] v kuchyni. A má to standardní rozvržení kuchyně se skříňkami,
[18:26] černou konvicí. Takže to fungovalo i s Ollamou.
[18:32] Pro ty z vás, kteří to zajímají, to spustím
[18:36] znovu, ale tentokrát použiji Open AI místo Ollamy. Takže
[18:43] vybírám tento a klikám na Provést akci.
[18:55] To je pravděpodobně zhruba stejný čas, co se týče rychlosti, ale možná
[19:01] je skutečná analýza a rozpis informací o něco
[19:07] podrobnější. Takže to běží lokálně a je plně
[19:12] zapojeno do Home Assistant. Pokud chcete pokračující video, kde jsem dočasně
[19:17] přepnul tento počítač na Linux a ukázal samostatné nastavení LMM, dejte mi
[19:22] vědět v komentářích. Stiskněte tlačítko To se mi líbí, pokud vám to pomohlo,
[19:27] a přihlaste se k odběru upozornění, až budou k dispozici další tutoriály o automatizaci Smartome
[19:32] . Díky za sledování a uvidíme se u dalšího dílu. Zatím ahoj
[19:36] .
⚡ Saved you time reading this? Transcribe any YouTube video for free — no signup needed.