Monthly Archives: 二月 2024

雜談 ( 2 )

        「博奕智慧 – 重貼」 ( 32 )

        「第四章:(二) 如何走出囚犯困境:再談【囚犯困境】」

        為了論證面對「囚犯困境」時人們可選擇的策略以及這些策略的有效程度,美國的國際關係學學者羅伯特.愛克斯組織了一次以此為主題的電腦程式競賽。規則是這樣的:

        囚犯雙方都不知道對方將如何選擇,兩個不同的程式相遇,祇有四個可能,即:合作對合作;合作對背叛;背叛對合作及背叛對背叛。如果雙方選擇合作,可以同得3分。如果一方合作,另一方背叛,則背叛的一方可得5分,它佔到了便宜,合作一方得0分,那是「給笨蛋的報酬」扣3分。如果雙方都背叛,那麼都得到1分。

        有62位專家寫了不同程式在電腦上相逢,經過無數次的博奕,最後以總積分的多少來判定勝負,有些程式永遠選擇背叛,有些程式永遠選擇合作,有些程式有時選擇背叛 (隨機的),有些程式有時選擇合作 (有序的),總之是各式各樣不同的程式,模擬現實生活中不同的處世態度。

雜談

        「博奕智慧 – 重貼」 ( 31 )

        「第四章:(一) 如何走出囚犯困境:為什麼我們沒有成為【囚犯】?」

        現實生活中的人,跟理論假定的「理性的人」是有區別的。

        我們看到地鐵,火車站,旅遊景點這些人流動性大的地方,商品和服務的品質通常會較差,甚至假貨橫行,這是因為在商家和顧客之間「沒有明天」,一個旅客不大會因為你的飯菜可口而再來光顧你的飯店,即使旅客買到了質量差的貨品,他也不願意長途跋涉再回來投訴。

        在公共汽車上,兩個陌生人可能會為爭座位而爭吵,但如果他們認識,就會互相謙讓。

        道德,法律,權力,利益的確認,都同我們「還要見面」有關。

        譬如兩個原始人見面,一個拿著獸皮,一個拿著果子,他們都想把對方的東西據為己有。如果他們的見面是偶然的,他們可能撕殺起來,強搶對方的東西。如果大家住在附近,是相識的,就會考慮到對方部族的報復,不敢強搶對方的東西,於是所有權就產生了。如果他們都想要對方的東西,以物易物,交易就產生了。

        還有社會的人跟人的博奕,不是孤立的事件,你可能一輩子都將另一個人踩在腳下,但如果因此而雙方都生活得很糟,那就不是好的選擇。

        兩個相鄰的國家,如果互相敵對,是一件很不幸的事,雙方不可能「搬家」,也不能壓倒對方,以前這樣的「宿敵」可以對抗幾百年,兩敗俱傷,現在大家都明白要合作,創造和平環境,通過合作締造雙羸。

雜談 ( 1 )

         今天共有兩篇雜談。

        「AI熱不是炒作,帶來真實回報」

        微軟發表了最新一季季報,雲業務收入增加30%,Window跟辦公室軟件利潤增15%,遊戲業務也大升,全季盈利比上季升20%,更值得一提的是管理層說CHATGPT的人工智能,去年還在討論和摸索的階段,現在已進入應用的階段,客戶踴躍熱烈,前景亮麗,而通過私人電腦在採用AI技術的已有四億人!雖然宣佈業績後股價下跌,但這是前一階段升得太多,獲利貨套現的結果,長線來看微軟的業務前景無量!

        我已持有不少微軟,帶來的盈利足以抵銷港股的虧損,仍在見低買入,準備長線投資。

        像這樣水平的AI能力是驚人的,但要發展它需要巨大的資本和許多極高端人才。

        中國的阿里巴巴,騰訊,百度有發展同樣能力的AI的可能性,但這些公司受到嚴格監管,盈利受壓,管理層不知有沒有資源來同微軟競爭?又有沒有這樣的意向?再不大規模的追趕,我們肯定會落後。

        真要投資AI,我的眼中祇有微軟一家,谷歌可以說有類似CHATGPT的東西,但已在市場上失去了先機,NVIDIA晶片公司P/E已奇高,現在面臨競爭,真正掌握AI技術並在市場上穩步推進的,祇有微軟一家!

雜談 ( 2 )

        「博奕智慧 – 重貼」 ( 30 )

        「第三章:(九) 納什均衡:誰該撥斷了線的電話?」

        假定某人正和女友通電話,通訊突然斷了,而話仍未說完,這時有兩個選擇,即立即打電話給對方或等對方打過來,如果雙方同時撥打,那雙方祇能聽到忙音,如果雙方都等待對方打來,則電話永遠不響了。

        這裡有兩個均衡:一個是男孩先打電話,而女友等在電話邊。另一個是女友先撥電話,而男孩等在電話邊。

        博奕的原理是:「納什均衡如果有兩個或兩個以上,結果就難以預料」,也就是說在這個案例中,博奕論沒有一個唯一的結論,告訴我們應怎麼做。

        在生活中我們祇能按照慣例,如果是戀愛中的男女,當然會由追求的一方主動再撥打電話。

        現在我們回顧一下,在同時行動的博奕中,我們有三種行動法則,一是尋找和運用「優勢策略」。二是尋找並避免劣勢策略。三是尋找和運用均衡。

雜談

        「博奕智慧 – 重貼」 ( 29 )

        「第三章:(八) 納什均衡:警察與小偷」

        在美國的西部片裡,常能看到這樣的故事。

        某小鎮上祇有一名警察,他要負責整個小鎮的治安。在鎮的一端有一家銀行,另一端有一家酒館。而在鎮上有一名小偷,警察由於分身乏術,一次祇能巡邏一個地方,而小偷一次也祇能去一個地方。假定銀行裡有2萬元財產需保護,而酒館裡有一萬元財產需保護。又假定如果警察去了一地方,而小偷也去了該地方,小偷就被捉住。而小偷去了警察沒有巡邏的地方,則小偷成功偷取財物。那麼警察應該如何巡邏才能得到最好的效果呢?

        思考的出發點是:

  1. 警察應較多地照顧銀行,因為那裡有較多財產需保護。

  2. 警察應該不讓小偷知道他的行動規律。

        所以警察的最佳策略是:隨機抽籤決定去銀行還是酒館,而且應該有三支籤,兩支是銀行,一支是酒館。小偷的策略跟警察的策略一樣,雙方都沒有純優勢的策略,沒有均衡點,結果難料。