2025年11月21日 星期五

AI 圖鑑新工具.google AI studio

AI繪圖大概區別為「天馬行空」(以文生圖)、「變更屬性」(例如吉卜力風格、雪景攝影風格)與「增減物件」(例如替換背景或名人合照等)三大種類,個人較注意飛羽攝影,鳥種拍不滿,不會畫圖,所以整理鳥種時,攝影類的圖鑑玩不了,手繪圖鑑型更是遠在天邊,恰逢2025 AI起飛年,運用免費的AI服務開始進行鳥種照片圖鑑化的工程,之前我也撰寫過『AI生成圖鑑(以 ChatGPT、Manus 為例) 』這篇文章大概介紹透過這2個網站的服務來產生手繪風格的圖片。AI起飛的關鍵在於google發表的LLM(大型語言模型),但我覺得好用的生成工具竟然沒google,那時也有試著用 gemini 生成,只是效果不佳,所以並未列入推薦使用的清單。

在2025年底google發表了gemini 3 pro,我喜愛使用的圖鑑生成功能竟然可以直接製作成app來轉換(目前只能在 google AI Studio 平台上連網運作,尚無法獨立為單機軟體),這樣作的意義在於:
①相同的指令就包含在app裡,不用單張照片、單張照片一次又一次的重覆輸入差不多指令;
②免費成生的額度相當多(應該超過100次/日),生成的結果不滿意再生一次,再不滿意再生成一次,通常超過3次不滿意就建議放棄,換一張照片試試。總結生成圖片的準確度高於 ChatGPT 與 Manus (因為可以挑選的照片多而非準確率較高),而且生成速度與數量上遠勝這兩家。建議有興趣的朋友一定要試一試,AI工具本來就需要重覆試誤改進,額度過少、速度過慢實在難用。

google AI studio APP 產出的圖鑑大概有3類風格(這背後的運作難以改變):
①照片刷淡再加一些外框線(這種的還不如直接用照片);
②很像卡通型(但又有圖鑑風格),這種的還算特別,部分可用;
③圖鑑風格,這種的就很好用。這也是之前建議同一張照片試3次就好的原因,再試也離不開這3種風格。

至於如何修改生成圖以達到更精確的結果?就留待有識之士分享更好的app指令吧。

以下是我用不同帳號所生成的幾種指令供參:(好像相同的指令用不同帳號生成的app,界面與生成效果也會有所不同,難以理解其背後運作)
①According to the picture to generate a hand-drawn illustration in a field guide style, The illustration must focus on precise anatomical proportions, correct rendering of plumage patterns and colors for the bird, simplify the environments. Without text labels.

②製作一個可以將鳥類照片轉換成圖鑑式照片的程式,要能生成手繪圖鑑風格的圖片,精準各器官的部位比例並正確描繪花紋形狀及顏色,並簡化背景環境,勿標示文字。

③製作一個可以將鳥類照片轉換成圖鑑式照片的程式,要能生成手繪圖鑑風格的圖片。由使用者上傳鳥類參考照片及鳥種名稱,除精準參考照片的各器官的部位比例及描繪花紋形狀及顏色外,也要參考網路上該鳥種之資訊,如有部分身體遭前景遮住,應儘量補齊。虛化背景環境,勿標示文字。

進入 google AI Studio 就會要求 google 帳號登入(網路有人分享用美國學生身分申請的帳號可以有一年免年費高級服務,我沒用過,請自行蒐尋),然後就是要求平台可以存取 google 的雲端空間,對話框就可以輸入指令,之後生成app程式斫需要小等一段時間後,就沙盒可以上傳照片→.→生成圖片了。











生成圖例(第3個app生成)


鉛色水鶇(雌)

鉛色水鶇(雄)

黃喉鵐(雄)

棕扇尾鶯(錦鴝)

鷦鷯

黑頭文鳥

灰林鴿

黑腹鵑隼(很遠,100%裁切圖生成)
生成圖例(第2個app生成,這app就比較卡通化)

小彎嘴畫眉



珫球歌鴝

紅鳩

魚鷹

黃鸝

鴛鴦

黑喉鴝(繁殖羽)

深山竹雞

綠繡眼

野鴝

粉紅鸚嘴(比較像照片刷淡)

栗耳鵐


沒有留言:

張貼留言