IA Soberana – H2A Comunicación https://h2acomunicacion.cl/cerebrodigital Laboratorio de IA, Tecnología y Comunicación Fri, 06 Feb 2026 00:55:28 +0000 es-CL hourly 1 Guía: Overhead Mínimo en Inferencia Sub-4-Bit con Paged Attention https://h2acomunicacion.cl/cerebrodigital/2026/02/02/guia-overhead-minimo-en-inferencia-sub-4-bit-con-paged-attention/ https://h2acomunicacion.cl/cerebrodigital/2026/02/02/guia-overhead-minimo-en-inferencia-sub-4-bit-con-paged-attention/#respond Mon, 02 Feb 2026 13:00:00 +0000 https://h2acomunicacion.cl/cerebrodigital/?p=3490 https://h2acomunicacion.cl/cerebrodigital/2026/02/02/guia-overhead-minimo-en-inferencia-sub-4-bit-con-paged-attention/feed/ 0 Minimizando la Latencia de Carga en Edge AI: Despliegue de mmap con Podman y Volúmenes https://h2acomunicacion.cl/cerebrodigital/2026/01/31/minimizando-la-latencia-de-carga-en-edge-ai-despliegue-de-mmap-con-podman-y-volumenes/ https://h2acomunicacion.cl/cerebrodigital/2026/01/31/minimizando-la-latencia-de-carga-en-edge-ai-despliegue-de-mmap-con-podman-y-volumenes/#respond Sun, 01 Feb 2026 00:54:29 +0000 https://h2acomunicacion.cl/cd/2026/01/31/minimizando-la-latencia-de-carga-en-edge-ai-despliegue-de-mmap-con-podman-y-volumenes/ https://h2acomunicacion.cl/cerebrodigital/2026/01/31/minimizando-la-latencia-de-carga-en-edge-ai-despliegue-de-mmap-con-podman-y-volumenes/feed/ 0 Evaluación de Q2_K en 4GB VRAM: Benchmark y Optimización de Capas https://h2acomunicacion.cl/cerebrodigital/2026/01/29/evaluacion-de-q2_k-en-4gb-vram-benchmark-y-optimizacion-de-capas/ https://h2acomunicacion.cl/cerebrodigital/2026/01/29/evaluacion-de-q2_k-en-4gb-vram-benchmark-y-optimizacion-de-capas/#respond Thu, 29 Jan 2026 13:00:00 +0000 https://h2acomunicacion.cl/cerebrodigital/2026/01/29/evaluacion-de-q2_k-en-4gb-vram-benchmark-y-optimizacion-de-capas/ https://h2acomunicacion.cl/cerebrodigital/2026/01/29/evaluacion-de-q2_k-en-4gb-vram-benchmark-y-optimizacion-de-capas/feed/ 0 Aislamiento de LLMs Locales: Configuración Strict-Mode con iptables https://h2acomunicacion.cl/cerebrodigital/2026/01/23/aislamiento-de-llms-locales-configuracion-strict-mode-con-iptables/ https://h2acomunicacion.cl/cerebrodigital/2026/01/23/aislamiento-de-llms-locales-configuracion-strict-mode-con-iptables/#respond Fri, 23 Jan 2026 02:51:34 +0000 https://h2acomunicacion.cl/2026/01/23/aislamiento-de-llms-locales-configuracion-strict-mode-con-iptables/ https://h2acomunicacion.cl/cerebrodigital/2026/01/23/aislamiento-de-llms-locales-configuracion-strict-mode-con-iptables/feed/ 0 QLoRA en 4GB VRAM: Protocolo de Optimización y Métricas de Rendimiento https://h2acomunicacion.cl/cerebrodigital/2026/01/01/qlora-en-4gb-vram-protocolo-de-optimizacion-y-metricas-de-rendimiento/ https://h2acomunicacion.cl/cerebrodigital/2026/01/01/qlora-en-4gb-vram-protocolo-de-optimizacion-y-metricas-de-rendimiento/#respond Thu, 01 Jan 2026 13:00:00 +0000 https://h2acomunicacion.cl/cerebrodigital/2026/01/01/qlora-en-4gb-vram-protocolo-de-optimizacion-y-metricas-de-rendimiento/ https://h2acomunicacion.cl/cerebrodigital/2026/01/01/qlora-en-4gb-vram-protocolo-de-optimizacion-y-metricas-de-rendimiento/feed/ 0 Optimización de Latencia en Inferencia Local: Pipelining NVMe/SSD a RAM para Edge AI https://h2acomunicacion.cl/cerebrodigital/2025/12/25/optimizacion-de-latencia-en-inferencia-local-pipelining-nvme-ssd-a-ram-para-edge-ai/ https://h2acomunicacion.cl/cerebrodigital/2025/12/25/optimizacion-de-latencia-en-inferencia-local-pipelining-nvme-ssd-a-ram-para-edge-ai/#respond Thu, 25 Dec 2025 10:00:00 +0000 https://h2acomunicacion.cl/2025/12/25/optimizacion-de-latencia-en-inferencia-local-pipelining-nvme-ssd-a-ram-para-edge-ai/ https://h2acomunicacion.cl/cerebrodigital/2025/12/25/optimizacion-de-latencia-en-inferencia-local-pipelining-nvme-ssd-a-ram-para-edge-ai/feed/ 0 Guía Técnica: Optimización de Scheduling de Offload en iGPUs con ROCm y SYCL https://h2acomunicacion.cl/cerebrodigital/2025/12/18/guia-tecnica-optimizacion-de-scheduling-de-offload-en-igpus-con-rocm-y-sycl/ https://h2acomunicacion.cl/cerebrodigital/2025/12/18/guia-tecnica-optimizacion-de-scheduling-de-offload-en-igpus-con-rocm-y-sycl/#respond Thu, 18 Dec 2025 10:00:00 +0000 https://h2acomunicacion.cl/2025/12/18/guia-tecnica-optimizacion-de-scheduling-de-offload-en-igpus-con-rocm-y-sycl/ https://h2acomunicacion.cl/cerebrodigital/2025/12/18/guia-tecnica-optimizacion-de-scheduling-de-offload-en-igpus-con-rocm-y-sycl/feed/ 0 Inferencia LLM Optimizado en ARM64: Guía con Ollama y Docker https://h2acomunicacion.cl/cerebrodigital/2025/12/11/guia-para-implementar-inferencia-llm-optimizado-con-ollama-en-arm64/ https://h2acomunicacion.cl/cerebrodigital/2025/12/11/guia-para-implementar-inferencia-llm-optimizado-con-ollama-en-arm64/#respond Thu, 11 Dec 2025 10:00:00 +0000 https://h2acomunicacion.cl/2025/12/11/guia-para-implementar-inferencia-llm-optimizado-con-ollama-en-arm64/ https://h2acomunicacion.cl/cerebrodigital/2025/12/11/guia-para-implementar-inferencia-llm-optimizado-con-ollama-en-arm64/feed/ 0 Optimización de QLoRA: Guía para Fine-Tuning de Modelos Grandes en GPUs de 8GB VRAM https://h2acomunicacion.cl/cerebrodigital/2025/12/04/optimizacion-de-qlora-guia-para-fine-tuning-de-modelos-grandes-en-gpus-de-8gb-vram/ https://h2acomunicacion.cl/cerebrodigital/2025/12/04/optimizacion-de-qlora-guia-para-fine-tuning-de-modelos-grandes-en-gpus-de-8gb-vram/#respond Thu, 04 Dec 2025 10:00:00 +0000 https://h2acomunicacion.cl/2025/12/04/optimizacion-de-qlora-guia-para-fine-tuning-de-modelos-grandes-en-gpus-de-8gb-vram/ https://h2acomunicacion.cl/cerebrodigital/2025/12/04/optimizacion-de-qlora-guia-para-fine-tuning-de-modelos-grandes-en-gpus-de-8gb-vram/feed/ 0 Guía para Medir la Carga de K-Quants (GGUF) en Arquitecturas de CPU Heterogéneas https://h2acomunicacion.cl/cerebrodigital/2025/11/27/guia-para-medir-la-carga-de-k-quants-gguf-en-arquitecturas-de-cpu-heterogeneas/ https://h2acomunicacion.cl/cerebrodigital/2025/11/27/guia-para-medir-la-carga-de-k-quants-gguf-en-arquitecturas-de-cpu-heterogeneas/#respond Thu, 27 Nov 2025 10:00:00 +0000 https://h2acomunicacion.cl/2025/11/27/guia-para-medir-la-carga-de-k-quants-gguf-en-arquitecturas-de-cpu-heterogeneas/ https://h2acomunicacion.cl/cerebrodigital/2025/11/27/guia-para-medir-la-carga-de-k-quants-gguf-en-arquitecturas-de-cpu-heterogeneas/feed/ 0