ComfyUI-Florence2

ComfyUI-Florence2

什麼是 Florence2?

Florence2 是 Microsoft 開發出來的視覺語言模型 VLM。用來處理影像、物件及相關文字(OCR) 的任務

Florence-2 is an advanced vision foundation model that uses a prompt-based approach to handle a wide range of vision and vision-language tasks.

我們可以在 ComfyUi 裡面套用 Florence2 這個模型來幫我們辨識圖片,產生這個圖片的文字描述,當作我們繪圖的 Prompt 來進行繪圖。

記住,這樣的方式是 Text 2 Image 文字生成圖片;而不是 Image 2 Image 圖片生成圖片。


References