Bạn đang tìm hiểu về Stable Diffusion AI dành cho người chưa biết gì? Bạn đã đến đúng nơi rồi. Trang này sẽ cung cấp cho các bạn đầy đủ từ cơ bản đến nâng cao, từ việc cài đặt đến cách sử dụng để ứng dụng vào công việc về thị giác của bạn, bao gồm chụp ảnh, làm phim, thiết kế đồ họa, thiết kế nội thất ngoại thất,…
Trước tiên, hãy làm quen với một vài khái niệm đã nhé.
Stable Diffusion AI là phần mềm cho phép chuyển văn bản thành hình ảnh dựa trên các kỹ thuật khuếch tán. Sử dụng mô hình học sâu và bộ dữ dữ liệu đa dạng, nó có khả năng tạo ra những hình ảnh đồ họa chất lượng cao, có khả năng ứng dụng rộng rãi trong ngành sáng tạo thị giác.
Stable Diffusion phiên bản mới nhất được phát hành miễn phí theo giấy phép mã nguồn mở MIT từ công ty Stability AI – một công ty về trí tuệ nhân tạo có trụ sở tại London, Vương quốc Anh. Cùng tham gia phát triển Stable Diffusion còn có nhóm CompVis từ Đại học Ludwig Maximilian München (Đức) và công ty Runway AI (Mỹ).
Về bản chất, Stable Diffusion được tạo nên từ rất nhiều các dự án mã nguồn mở về trí tuệ nhân tạo khác, chi tiết bạn có thể xem phần Shout-Outs tại trang phân phối chính thức của Stable Diffusion trên github.com
Bản thân Stable Diffusion chỉ là một phần mềm, hiểu nôm na là nó giúp xử lý dữ liệu đầu vào và xuất ra hình ảnh. Để sử dụng được Stable Diffusion bạn cần có mô hình dữ liệu đã được huấn luyện, rất may là Stable Diffusion được phát hành kèm theo bộ dữ liệu này (còn được gọi là base model). Hiện tại phiên bản mới nhất là SDXL 1.0. Từ base model này, cộng đồng sẽ huấn luyện và bổ sung thêm từ các hình ảnh chi tiết và chuyên sâu hơn, từ đó chúng ta có thêm các loại mô hình dữ liệu khác thường thấy như Checkpoint, LoRA, ControlNet, Embedding, Upscale,…
Mặc định Stable Diffusion giao tiếp với người dùng thông qua các dòng lệnh (Terminal/ Command Prompt) khá khó khăn cho người dùng phổ thông. Vì vậy cộng đồng đã phát triển các giao diện đi kèm để giao tiếp với Stable Diffusion dễ dàng hơn, hiện nay có hai giao diện phổ biến nhất trong cộng đồng là Stable Diffusion web UI phát triển bởi Automatic1111 và ComfyUI được phát triển bởi Comfyanonymous
Vì được phát hành theo giấy phép mã nguồn mở MIT, nên Stable Diffusion hoàn toàn miễn phí, bạn có thể tải Stable Diffusion về máy và sử dụng cho mục đích của mình mà không cần trả tiền tuy nhiên bạn cần cân nhắc một số vấn đề khác mà HocAI sẽ chia sẻ thêm ở phần sau.
Một trở ngại khi sử dụng Stable Diffusion là nó sử dụng tài nguyên GPU để tạo hình ảnh, nghĩa là nếu máy của bạn không có card đồ họa rời (nhất là NVIDIA hỗ trợ CUDA – kiến trúc tính toán song song). Vì vậy không máy tính nào cũng có khả năng chạy Stable Diffusion mượt mà. Nắm được khó khăn đó, có nhiều đơn vị đang cung cấp dịch vụ chạy Stable Diffusion online (thông qua điện toán đám mây) và tất nhiên là bạn cần trả phí cho những dịch vụ như vậy.
Có một cách sử dụng Stable Diffusion miễn phí là sử dụng công cụ Colaboratory của Google, một công cụ cung cấp máy ảo chạy ngôn ngữ Python để phục vụ việc nghiên cứu đào tạo AI. Học AI sẽ có bài chi tiết sau.
Hôm nay có bạn thực hành theo một số video trên mạng nhưng không thấy giao diện của Automatic1111 (Stable Diffusion WebUI) giống như trong
So sánh những dịch vụ online hoặc Google Colab, cài đặt và sử dụng Stable Diffusion trên máy của bạn sẽ giúp bạn thuận tiện
Cùng học AI để ứng dụng vào công việc và cuộc sống