星期日, 24 9 月, 2023
More
    Home個人計畫

    個人計畫

    最近公司要與Google合作

    最近經過了一兩個月比較前三大雲端服務,然後在Google熱情的邀請下,決定與Google成為合作夥伴,使用它們的雲端服務Google Cloud。 仔細的比較了三大雲端服務,發現Google是最能節省初始成本的,後續成本也是最低的。合作還有Credit,在前五年大概都不會被收到錢吧,開始被收到錢的時候公司也賺到翻了。 明天來寫寫三大雲端平台的比較好了,似乎不是太多人寫這種文章,我身為一個公司的技術長,是掌握公司的技術方向,所以見解應該也有點參考價值。 AWS、Azure、Google Cloud我都有用過,小的雲如Digital Ocean我也有用過。虛擬主機更是不知道加了多少不同的公司會員過。 要說網路雲端的了解我如果說我懂的少,我想懂的多的人應該也不多,就是有這樣的自信,畢竟我也在網路上打滾了十多年了。 只是精神跟體力真的有夠累,確定要合作以後鬆了一口氣,整個人陷入無力狀態。 目前我打算用的服務有 Cloud Run、Google Kubernates Engine、Firebase(Hosting)、Cloud SQL(MS SQL Server)、Security Command Center、reCaptcha企業版。 這些不知道花了多少的時間把他們一過一個都熟悉了,我本身是程式設計的研發人員出身,並不是雲端架構師或者MIS人員,不知道死了多少腦細胞。 明天228連假,連假完成要給對方申請的資料,也就是又要加班了。資料還需要附上在他們平台實作的證明與解決方案,我的程式還要改寫一下,才有辦法從AWS的EC2轉到Google Cloud Run(主要是在驗證碼的部分要改成reCaptcha)。 Cloud SQL還要把AWS的SQL備份下來還原上去,我想JetBrain的DataGrip也許可以幫我省一點時間。 然後更新Firebase的檔案成靜態的Angular檔案,API連線到Cloud Run(.NET 7.0 C#寫產生的容器),連線到Cloud SQL,再按照架構連到模擬客戶的地端SQL。 GKE(也就是K8s)是打算下一個階段做的,那個等合作開始一陣子客戶變多,Cloud Run和GKE可能會混搭使用。 Serverless的架構真的比虛擬機器好太多了,成本、安全性、穩定度各種都高。雖然開發門檻高,但我本身出身就是高階的研發工程師,雖然已經35快36歲,但還是學得會的。 我現在只想要暴睡一天,然後再開始工作。

    Google Colab Pro 實際用的初步心得

    Google Colab 本身是免費的Python語系雲端GPU平台,免費的版本可以調用大約10GB的顯示卡記憶體,對於我最近想要做A.I.自動繪圖,RTX 3080顯卡10GB的很明顯不夠,只能跑出400*400左右的圖,因此就考慮試用Google Colab。 實際使用狀況 Google Colab就像Python的Jupyter Notebook一樣,然後結合我的Google Workspace的硬碟空間,只要加一兩行的程式碼就可以讓雲端空間如同硬碟一樣讓程式輸入或者輸出檔案。 也不用煩惱在本機很討厭的一個版本相容性問題,比如Python 3.9支不支援 Pytorch GPU運算的哪個版本這樣的問題,在Google Colab只要用!pip install ....後面把版本指定好,不用在本機用Pychram建立一堆Python環境(這大概只有Python使用者聽得懂),簡單來說就是「版本相容性很容易解決」。 但CPU的運算功能實在有夠慢,因為Google Colab主打是GPU,因此CPU的效能大概只有我寫程式電腦12核心的1~2個核心速度。 免費使用的話記憶體是10.xGB,這樣其實和我自己機器跑沒差多少。 Google Colab Pro 所以想了一下就花了10.5美金/月(原價9.99美金要加5%稅金)刷了Pro的版本,Pro+的版本要49.9未稅價格一個月,想說先試用看看Pro到底差在哪裡,再考慮要實作的時候是節省時間成本還是節省金錢成本(時間也是成本之一)。 目前使用Pro的話,平均可以分配到的顯示卡記憶體在15~16GB之間,其實還沒到RTX 3090的記憶體大小,如果當初知道要跑這個我應該會直接在顯卡剛出的時候就搶一張RTX 3090。(現在加密貨幣挖礦的關係顯卡價格還是居高不下) 運算速度在跑A.I.自動繪圖的時候,我讓程式重複修正圖片500次,平均是「1.9次/秒」,而同樣的程式碼在RTX 3080跑是「4.8/秒」,速度是差很多。 但接下來要說一下為何我還是決定要用Google Colab Pro甚至跑一陣子要升級到 Pro +。 使用的初步結論 由於Google Colab 想也知道是在一台或是多台很棒的GPU伺服器或者GPU伺服器陣列裡面運作,然後按照狀況分給我們資源,因此只要不要違反規定如用他們的GPU來挖礦,都是以機器學習的性質,Pro開著瀏覽器可以連續跑12小時,Pro+在關閉瀏覽器後可以跑24小時不中斷。 我即使有一台Macbook Pro、一台iMac和一台Windows PC,因為能跑Pytorch機器學習的只有Windows PC,因此寫程式也得在上面。我iMac和Macbook Pro是用來做音樂和寫網站的。那如果我讓Windows PC的GPU跑12個小時,等於我12個小時都不用做事了。 而相對的我只要挑一台電腦,開著瀏覽器12小時(Macbook Pro或者iMac我幾乎是24小時全年開機的),這樣我就可以用另外兩台,甚至開著瀏覽器的電腦做別的事情,時間成本的部分等我受不了速度慢再升級Pro+看看有沒有改善。 還有一點很重要的是硬體折舊與冷卻問題,我如果讓我的RTX 3080跑12小時,一定平均溫度是在攝氏60度以上,因為只有風扇散熱,我沒有做訂製的顯示卡水冷系統(當時組電腦並沒有這種東西是套裝的),我主機只有CPU有套裝水冷。 那這樣我顯卡一定很快就要送修了吧!再者一小時大約就要耗掉2元的電費(冬天電費一度電2.5元),顯卡跑全效能大概要花掉750瓦以上,24小時等於18度電要元45一天。半個月就超過訂閱Pro的錢了。 硬體全速跑的話,就算沒有燒壞,也會有折舊問題,因為這種東西越使用壽命會越短,全速進行中的硬體其實是要將保固算到折舊裡面。我的顯卡三年保固,也就是折舊也很高,相對的Google管理自己的顯示卡,折舊Google的事,燒壞Google的事。 其實這篇文章一點都沒有想推銷,只是想寫寫最近用的心得,建議一般人沒什麼特別用途就直接用免費的就好了,Pro或Pro+開放的國家似乎不支援台灣,我是用美國公司身份申請,雖然刷的是台灣國泰世華的世界卡(不知道世界卡會不會有差)。 總之大概今天就提供這些資訊給大家,我想要趕緊把我的A.I.自動繪圖程式的改到最滿意的階段,然後下一個階段是做主題畫冊在網路書城上出版。

    下一個挑戰,A.I.配合人工使用極短的時間產生有意義的部落格貼文

    其實最近已經挑戰了初步的A.I.繪圖(雖然要電腦畫啥要人類指示),也挑戰了初步的A.I.寫音樂(雖然有部分後製還是要人類),那下一步呢? 打算挑戰A.I.與人腦並用,在10分鐘內產生600字左右有意義的部落格貼文,不會出現之前嘗試過的文章產生器的句子:「因為瑞士是瑞士所以瑞士是瑞士」這類很無言的句子。 而且是要挑戰中文的文章產生,由於我本身對於文字的掌握度很高,所以應該可以很快速的和A.I.合作完成一篇600字左右具有一定意義的部落格貼文。 如果這個能達成的話,其實我們公司在人力的節省可以少很多,因為有些定期維護的部落格貼文就可以使用A.I.來創造大綱,寫骨架。然後最後由有一點文學素養的人修正錯誤的字詞,或者修正用語(如A.I.可能使用的是中國或者香港的用語,台灣人可能看不懂)。 其實A.I.的文章產生自從GPT-3出來以後,我就有實驗過了,我曾經拿自己寫的24萬字輕小說來訓練模型,然後A.I.會寫出很特別跟我文筆相當相似的小說,因為資料處理不夠好,還有標點符號問題,因此之前實驗到一半因為有別的事情就中止了。 當初買RTX 3080的顯卡,就是為了玩機器學習。原本是AMD的顯卡,但PyTorch和Tensorflow幾乎不支援AMD的OpenCL加速,用CPU訓練速度是比GPU慢20倍左右。 如果對A.I.產生的文字有興趣的,歡迎把我這個部落格加到書籤,大概3~7天左右回來看一下,應該會有很精彩的內容。
    Advertisingspot_img

    Popular posts

    I'm social

    0FansLike
    0FollowersFollow
    3,870FollowersFollow
    0SubscribersSubscribe