清華大學崔鵬:可信智能決策框架及實踐_當前熱文
一、一種可信智能決策框架首先和大家分享一種可信智能決策框架。1、比預測更重要的決策在實際的很多場景中
2023-05-04首先和大家分享一種可信智能決策框架。
【資料圖】
1、比預測更重要的決策在實際的很多場景中,決策比預測更加重要。因為預測本身的目的并不只是單純地預知未來長什么樣子,而是希望通過預測去影響當下的一些關鍵行為和決策。
在很多領域,包括商業(yè)社會學領域,做決策非常重要,比如持續(xù)的業(yè)務增長(Continual business growth)、新商業(yè)機會發(fā)現(xiàn)(New business opportunity)等,如何通過數(shù)據(jù)驅(qū)動來更好地支撐最終的決策,是人工智能領域不可忽視的一部分工作。
2、無處不在的決策決策場景無處不在。眾所周知的推薦系統(tǒng),給一個用戶推薦什么樣的商品,實際上是在所有商品里做了一個選擇決策(selection decision)。在電子商務中的定價算法,比如物流服務定價等,如何為一個服務制定一個合理的價格;在醫(yī)療場景中,針對病人的癥狀,應該推薦使用哪種藥物或者治療方式,這些都是干預性的決策場景。
3、決策的通常做法 1:用模擬器做決策學術界和產(chǎn)業(yè)界對決策都不陌生,有一些常用的方法去解決或是探討決策的問題,總結(jié)下來有兩種通常的做法。
第一種通常做法是用模擬器做決策,即強化學習(reinforcement learning)。強化學習是非常強大的一類做決策的方法體系,相當于有一個真實場景(environment),或者有一個對真實場景的模擬,就可以通過智能代理(agent)不斷和真實場景進行試錯學習,不斷探索關鍵行為(action),最終找到在此真實場景中收益(reward)最大的關鍵行為。
整套強化學習的決策體系在很多實際應用問題上,會被大家首先想到。但是在真實的應用場景下,使用強化學習最大的挑戰(zhàn)是有沒有一個很好的對真實場景的模擬器。模擬器的構(gòu)建本身就是一項極具挑戰(zhàn)性的任務。當然比如阿爾法狗(Alphago)象棋等游戲場景,總體上來講規(guī)則是相對封閉的,去構(gòu)造一個模擬器還是比較容易的。但是在商業(yè)上和真實生活中,大多是開放性的場景,比如無人駕駛,很難給出一個非常完備的模擬器。要構(gòu)造出模擬器,就需要對該場景有非常深入的理解。因此,構(gòu)造模擬器本身可能是比做決策、做預測更難的一個問題,這實際上是強化學習的局限性。
4、決策的通常做法 2:用預測做決策另外一種通常做法就是用預測去做決策。指的是,雖然現(xiàn)在不知道什么樣的決策好,但假如有一個預測器,能夠在預測空間里邊“打哪指哪”,如下圖左邊所示,像人射箭一樣,可以先放幾箭去打靶子,發(fā)現(xiàn)哪一箭射得比較好,就取這一箭的關鍵行為做相關決策。如果有這樣的一個預測空間,就可以用預測做決策。
但是決策的效果取決于預測空間的準確性,到底預測得準不準。雖然在預測空間,打中了 10 次靶子,但當應用到實際的生活或產(chǎn)品時,中靶次數(shù)為 0,這就說明預測空間是不準的。到目前為止在預測任務上,最有信心的一個場景是在獨立同分布假設下做預測,即測試分布(test distribution)和訓練分布(training distribution)是同一個分布,當下有非常多強大的預測模型(prediction model),可以很好地解決實際問題。這就告訴我們:預測準確性好不好,某種程度上取決于實際場景下的測試數(shù)據(jù)和訓練數(shù)據(jù)的分布是不是滿足獨立同分布。
繼續(xù)深入思考一下預測準確性問題。假設基于歷史數(shù)據(jù) P(X,Y) 構(gòu)造了一個預測模型,然后去探索一些不同的關鍵行為所帶來收益,即如前面所述的多次射箭,看到底哪一次靶數(shù)最大。拆解一下,可以分為兩類不同的情況。
第一類是給定決策變量,優(yōu)化取值。事先知道了輸入變量 X 中哪一個是比較好的決策變量,比如價格是 X 里面的一個決策變量,則變化價格變量的取值,用已構(gòu)造出來的 P(X,Y) 預測模型去預測改變?nèi)≈岛蟮那闆r如何。
另外一類是尋求最優(yōu)決策變量,并優(yōu)化取值。事先并不知道 X 中哪一個是比較好的決策變量,場景上相對比較靈活,需要尋求最優(yōu)的決策變量并優(yōu)化其取值,也就是變化最優(yōu)的決策變量的取值,然后看哪個取值經(jīng)過預測模型預測的結(jié)果好。
基于這樣的前提假設,在改變決策變量的取值時,實際上是改變了 P(X),即 P(X) 發(fā)生了變化,P(X,Y) 肯定會發(fā)生變化,那么獨立同分布的假設本身就不成立了,意味著預測實際上很有可能失效。因此決策問題,如果用預測的方式來做,就會觸發(fā)分布外泛化的問題,因為改變了決策變量的取值,一定會發(fā)生分布偏移(distribution shift)。在分布偏移的情況下,怎么樣做預測,是屬于分布外泛化的預測問題范疇,不是今天文章的主題。如果在預測領域能夠解決分布外泛化的預測問題,用預測做決策也是可行的路徑之一。但當下用 ID(In-Distribution)或者直接預測(direct prediction)的方法做決策,從理論上來講是失效的,是有問題的。
5、決策問題是因果范疇在談到?jīng)Q策問題時,通常都會直接把決策問題和因果掛鉤,所謂決策,就是要做一個什么樣的決定,肯定要問為什么做這樣一個決定,很明顯存在因果鏈條,在學界很多學者的共識是:要解決決策問題,是繞不開因果的,也就是要從可觀測的數(shù)據(jù)(observational data)上來去獲取足夠的因果關系信息(causal information),并理解相關的因果機制(causal mechanism),然后基于因果機制再去設計最終做決策的一些策略。如果能夠把整個過程都理解得很透徹,就能完美地復原整個因果機制,這樣決策就不是問題,因為實際上相當于具有了上帝視角,就不存在做決策的挑戰(zhàn)。
6、一種對決策的框架性描述早在 2015 年,Jon Kleinberg 就在一篇論文中發(fā)表過:決策問題不是只有因果機制能解決,即不是所有的決策問題都需要因果機制去解決。Jon Kleinberg 是康奈爾大學的知名教授,著名的 hits 算法、六度風格理論等都是 Jon Kleinberg 的研究成果。Jon Kleinberg 在 2015 年發(fā)表了一篇關于決策問題的論文,“Prediction Policy Problems”[1]。他認為有些決策問題就是預測策略問題,并且為了證明該論點,給出了一種對決策的框架性描述,如下圖所示。
Π 是收益函數(shù)(Payoff function),x0是決策變量(Decision Variable),Y 是因決策變量產(chǎn)生的結(jié)果(Outcome),Π 實際上是x0和 Y 的函數(shù)。那x0怎樣變化,Π 是最大的,就可以去求這樣的一個導數(shù) :
然后將它展開為:
展開后,根據(jù) Y 和x0是否不相關,等式右邊分別刻畫了兩種決策(decision)場景。第一種決策場景,就是 Y 和x0不相干時,即,但和 Y 是有關系的,這種情況下,如果能夠很好地預測 Y,就能用已預測的 Y,更有針對性地用來做決策,這就是預測性決策問題。另外一種決策場景為,x0做了這樣的一個決策,會影響 Y,Y 又會影響收益,這就是一個因果性決策問題。那什么情況下決策場景是因果性的,什么情況下是預測性的呢,后續(xù)會有案例解釋;當然也有復合性決策場景,既有因果性的,又有預測性的。到此,就初步地框架性地描述了決策問題是怎樣的。
7、決策場景的兩個案例如上圖所示的兩種決策場景,其中x0是決策變量(decision variable),在兩個場景下的定義是分別不同的。
先看左邊的場景案例。要不要帶傘,和是否下雨之間是沒有關系的,即x0和 Y 不相關,帶入到
中,即:
為 0,則:
那么預測出來是否要下雨,最終的收益是不一樣的。所以這個例子很明顯是一個預測性決策(prediction decision)。
右邊的案例是如果你是一個酋長,要不要花錢請人跳大神求雨,實際上很大程度上取決于“跳大神”到底能不能求到雨,是否有因果效應。等式右側(cè)的
,如果能預測出來是否下雨,那么:
為 0,即收益(是否下雨)和決策變量(跳不跳大神)其實是沒有任何關系的。那么這就不是一個預測性決策,是一個純粹的因果性決策。
通過上述兩個實際的決策案例場景,可以將決策問題劃分為兩類:預測性決策和因果性決策,并且 Jon Kleinberg 給出的決策問題的框架,也很好地說明了對決策的劃分。
8、決策的復雜性Jon Kleinberg 的論文中給出的一個觀點是,對于預測性決策問題,就只管預測的好不好,因果機制不一定是必須的,預測模型在決策場景上很好用,對決策問題有很好的表達能力,可以把很多情況都融合在一起。但實際上決策的復雜性是超出之前對預測場景的理解的。大部分情況下,在解決預測問題時,只是盡力而為(best effort),盡量用更復雜的模型,更多的數(shù)據(jù),希望提升最終的準確率,即盡力而為的模型(best effort model)。
但決策場景下受制約的限制因素遠比預測要多。決策實際上是最后一公里,最后做出的某個決策確實會影響方方面面,影響很多利益相關主體,涉及到非常復雜的社會性、經(jīng)濟性的因素。例如,同樣是貸款,對于不同性別、不同區(qū)域的人是否存在歧視,就是很典型的算法公平性問題。大數(shù)據(jù)殺熟,同樣的商品對不同人給出不同的價格,也是一個問題。近幾年來大家深有體會的信息繭房,就是不斷按照用戶興趣或者相對比較窄的頻譜上的興趣,集中地對某個用戶進行推薦,就會造成信息繭房。長此以往,就會出現(xiàn)一些不好的文化和社會現(xiàn)象。所以做決策時,要考慮更多的因素,才可以做出可信的決策。
9、一種可信智能決策的框架從決策可信角度對 Jon Kleinberg 給出的決策問題框架繼續(xù)進行解讀。雖然 Jon Kleinberg 本身提出這個決策問題框架是主張預測模型(prediction model)對于決策問題的有效性,但實際上該決策問題框架的內(nèi)涵非常豐富,下面依次對該決策問題框架的各項進行解讀。
首先是最右邊的一項:
針對一些反事實的現(xiàn)象,就是某些x0沒有出現(xiàn),但假設它出現(xiàn),到底 Y 會發(fā)生一些什么樣的變化,是一個典型的反事實推理,是因果推斷中核心的部分,當然在 Judea Pearl 給出的框架里,它是第三階梯了。關于反事實推理有很多不同的理解和解釋,這里所談到的反事實推理姑且認為是合理的。
第二項是,實際相當于收益函數(shù)和模型結(jié)果之間的關系。Y 和 Π 的關系有比較簡單的場景。比如進行商品推薦時,給用戶推薦什么樣的商品,用戶會點擊,優(yōu)化后的最后的收益函數(shù)(Payoff function),實際上就是總體點擊率。這種是兩者關系比較簡單的場景。但是實際業(yè)務中,不管是從平臺還是從監(jiān)管的角度,Y 和 Π 的關系大部分情況下是非常復雜的。比如后續(xù)會講到的一個案例,在做平臺的收益優(yōu)化時,不能只看當下的點擊率,要看長期收益;當看長期的收益時,Y 和 Π 的關系就會相對復雜,即復雜收益。
第三項是 Y,核心任務就是做預測(prediction),但如果預測(prediction)是用來做決策的,并且決策場景是社會屬性的,比如影響到個人征信,影響到高考是不是被錄取,影響到犯人是否會被釋放等,那么所有的這些所謂的預測性的任務,都會要求預測必須是公平的,不能去用一些比較敏感(sensitive)的維度變量,比如性別、種族、身份等去做預測。
第四項是:
,指的是收益和決策之間的關系。常規(guī)來講,應該是在收益最大化的前提下去做決策。但現(xiàn)實中,不管是國內(nèi)還是國際上,都逐漸地加大了對平臺性算法的監(jiān)管力度,即在收益函數(shù)(Payoff function)的設計上增加監(jiān)管因素,使得做決策時是有一定限制的。比如定價,不能平臺隨意定,而是在收益函數(shù)(Payoff function)里加入一些監(jiān)管因素,這就是可監(jiān)管決策。
這個決策問題框架包含了不同層面的場景,也可以認為它有以上四個不同的子方向。但是總體上以上四個子方向都和可信決策是非常相關的,也就是如果要保證角色可信,必須要考慮方方面面的因素。但總體上來講,都可以用 Jon Kleinberg 給出的框架進行統(tǒng)一的表述。
接下來會依次介紹可信智能決策框架下的四個子方向:反事實推理、復雜收益、預測公平性和可監(jiān)管決策。
二、可信智能決策中的反事實推理首先介紹關于可信智能決策框架下的反事實推理的一些思考和實踐。
1、反事實推理反事實推理有三個場景。
第一是策略平均效果評估(Off-Policy Evaluation)。對于一個給定的策略(policy),不希望進行 AB 測試,因為 AB 測試成本太高,因此在離線數(shù)據(jù)上評測該策略上線后,會有什么樣的效果,就相當于對整個族群(population)或所有 sample 進行評測,比如對所有用戶群體的一個整體效果評估。
第二是策略個體效果評估(Counterfactual Prediction),是對策略在一個個體層面的效果進行預測,不是整體平臺性策略,而是針對某個個體進行一定的干預后,會有什么樣的效果。
第三是策略優(yōu)化(Policy Optimization),即怎么樣去為一個個體選擇效果最好的干預。和個體效果預測不一樣,個體效果預測是先知道怎么干預,然后預測干預后的效果;策略優(yōu)化是事先不知道怎么干預,但尋求怎樣干預之后的效果最好。
2、策略平均效果評估(1) 策略平均效果評估的問題框架概述策略平均效果評估,就是基于從策略 Π0(Behavior policy)產(chǎn)生的離線數(shù)據(jù) D,評估策略 Π(Target policy)的效用值(Utility)。
Π0是已有的一個策略,比如現(xiàn)有推薦系統(tǒng)中一直在用的推薦策略。
現(xiàn)有策略下產(chǎn)生的離線數(shù)據(jù) D 蘊含至少三個維度,如上圖所示,xi就是背景信息(Context),比如在推薦系統(tǒng)中的用戶和商品的屬性;ai是行為, 比如推薦系統(tǒng)中某個商品有沒有對用戶曝光;ri是最終結(jié)果(reward),比如推薦系統(tǒng)中用戶是否最終點擊或者購買商品。
基于歷史數(shù)據(jù)去評測一個新的策略 Π(Target policy)的效用值(Utility)。所以整體的框架就是在某個背景(context)下,某策略(policy)會有對應的行為或者干預變量(treatment),這個干預變量(treatment)觸發(fā)后,就會產(chǎn)生對應結(jié)果。其中,效用值(Utility)即前述的收益(Payoff),在簡化 前提下,效用值就是所有用戶產(chǎn)生的結(jié)果的總和,或者平均效果。
(2)策略平均效果評估的現(xiàn)有方法傳統(tǒng)的策略平均效果評估方法是基于結(jié)果預測的方法(Direct Method),在新的策略(policy)下給定xi,對于主體,建議曝光還是不曝光,即對應的行為,就要預測如果進行了曝光,最終用戶會不會購買,或會不會點擊,即最終獲得的結(jié)果(reward)。但請注意,reward 實際上是一個預測函數(shù)(prediction function),是通過歷史數(shù)據(jù)得到的。歷史數(shù)據(jù)中的 x、a 和 r 的聯(lián)合分布(joint distribution)實際是在Π0下產(chǎn)生的,現(xiàn)在換了一個 Π 所產(chǎn)生的數(shù)據(jù)分布,再用原來Π0下產(chǎn)生的聯(lián)合分布預測模型(joint distribution prediction model)去做預測,很顯然這是一個 OOD(Out-of-Distribution)問題,如果后面用 OOD 預測模型,那么數(shù)據(jù)分布偏移問題有可能得到緩解,如果用一個 ID(In-Distribution)預測模型,原則上肯定會出問題。這是傳統(tǒng)的策略平均效果評估方法。
另外一種方法是基于因果推斷的,引入了傾向指數(shù)(propensity score),其核心思想是,用原始策略下的三元組(xi,ai,ri) 在新的策略下,到底應該使用什么樣的權重去加權最終產(chǎn)生的結(jié)果。權重應該是給定xi,在新策略下xi曝光(ai)的概率和在原有策略下xi進行曝光(ai)的概率之比,即在新的策略下,對一個三元組所對應的結(jié)果進行加權的一個系數(shù)。該種做法最難的地方是在原始策略下,給定xi后,對應ai的概率分布其實是不知道的,因為原始策略可能很復雜,也有可能是多個策略的疊加,并沒有辦法顯性地刻畫對應的分布,因此需要進行估算,那么就會存在估算是否準確的問題,并且該估算值在分母上,會導致整個方法的分布方差(variance)非常大。另外使用傾向指數(shù)(propensity score)的估計本身就存在問題,假設傾向指數(shù)(propensity score)的函數(shù)是線性的,還是非線性的,是什么形式,估計是否準確等等。
(3)策略平均效果評估的新方法:FCB estimator借鑒因果關系(Causality)的直接混淆變量平衡(directly confounder balancing),提出了對樣本直接加權的方法,使得加權后,可以保證在各個對應行為群(action group)的分布 P(X|ai)整體上和 P(X) 是一致的。
歷史數(shù)據(jù)是在給定 Π0的情況下產(chǎn)生的,要去掉因 Π0引起的分布偏差(bias),具體做法如上圖所示,原始的數(shù)據(jù)分布 P(X),在 Π0的作用下,相當于把 P(X) 劃分為若干個子分布 P(X|a=1)、P(X|a=2)、P(X|a=3)、...、P(X|a=K),即不同的行為下對應 P(X) 的一個子集,是無偏的分布,每個行為群下都有因 Π0而引起的偏差,要去掉偏差,可以通過對經(jīng) Π0而產(chǎn)生的歷史數(shù)據(jù)進行重加權,使得加權以后的所有子分布,都逼近原始分布 P(X),即樣本直接加權。
預測一個新的策略在歷史數(shù)據(jù)的前提下最終的效果會是什么樣的,需要分兩步進行。第一步,就是如前所述,先通過樣本直接加權的方式去掉原始策略 Π0所帶來的偏差。第二步,要預測新策略 Π 的效果,也就是在新策略 Π 引起的偏差下去預估最終的效果,所以需要加上新策略 Π 引起的偏差
因此:
其中wi就相當于第一步去掉Π0帶來的偏差:
相當于把新策略的偏差加上,這樣就可以預測一個新的策略最終的效果。具體方法不贅述,可以參考論文 [2]。
新方法 FCB Estimator 的最后提升效果如上圖所示,提升效果非常明顯,不管是從偏差(bias),還是 RMSE 的維度上來講,相對提升大概有 15%-20%。FCB Estimator 在變化 sample size 和 context 維度的不同場景下都顯著優(yōu)于 baseline。相關論文發(fā)表在 KDD 2019 [2]。
3、策略個體效果預測(1)策略個體效果預測的整體描述策略個體效果預測就是要充分考慮個體異質(zhì)性,直接對個體實施差別化干預,即尊重個體意志,對不同的個體實施不同的干預。
(2)現(xiàn)有方法的局限策略個體效果預測常用的方法是直接對個體進行預測建模,也就是基于歷史觀測數(shù)據(jù):
然后訓練得到反事實預測模型:
,即給定了 X 和 T,能比較合理和準確地預測實際效果 y 是怎樣的。
如果直接在歷史數(shù)據(jù)分布下,做回歸分析或者類似的模型,是有問題的。因為歷史觀測數(shù)據(jù)中的ti和xi并不獨立,直接學習(X,T)與 Y 直接的映射函數(shù)必然受到 X 與 T 之間的關系影響,也就相當于給定了一個xi,在歷史數(shù)據(jù)里面必然對應一個ti,比如ti就應該等于 0,當干預 T 時,比如硬要把ti改成 1,實際上就已經(jīng)不服從原來的歷史分布了,意味著在歷史數(shù)據(jù)分布下構(gòu)造出來的 ID(In-Distribution)預測模型就無效了,觸發(fā)了 OOD(Out-of-Distribution)。
因此在構(gòu)造所謂的預測模型時,就需要消除 X 和 T 之間的關聯(lián),分別估計 X 對 Y 的影響和 T 對 Y 的影響,這種情況,如果干預或改變了 T,和 X 就沒關系,到底對 Y 會有什么影響和變化,完全由 T->Y 這條鏈路決定,就不存在 OOD(Out-of-Distribution)問題了。
傳統(tǒng)做法是采用樣本重加權(Sample Re-weighting)的方法來去除 X 和 T 之間的關聯(lián),有兩種方法:(1)逆傾向性得分加權,(2)變量平衡。但這些方法都存在局限性:只適用于簡單類型的干預變量(treatment)場景,二值或離散值。在真實的應用場景下,比如推薦系統(tǒng),干預變量(treatment)維度很高,給用戶推薦商品,推薦的是一個束(bundle),即從很多商品中進行推薦。當干預變量(treatment)維度很高時,使用傳統(tǒng)的方法,把初始干預變量(raw treatment)和混淆變量(confounder) X 直接去關聯(lián),復雜度非常高,甚至樣本空間不足夠來去支撐高維度的干預變量(treatment)。
(3)策略個體效果預測新方法:VSR如果假設高維度的干預變量(treatment)存在低維隱變量結(jié)構(gòu),也就是給出高維度的干預變量(treatment)原則上不是隨機出來的,比如推薦系統(tǒng)中,給定推薦策略推薦出來的商品束(bundle),里面的商品和商品之間都有各種各樣的關系,存在低維隱變量結(jié)構(gòu),也就是推薦商品列表由若干因素所決定。
如果高維度的干預變量(treatment)下有一個隱變量(latent variable) z,實際上可以把問題轉(zhuǎn)化為 x 與 z 之間的去關聯(lián),即和隱性因素(latent factor)之間去相關。通過這種方式,可以在有限的樣本空間下實現(xiàn)束處理(bundle treatment)。
因此提出了新方法VSR。VSR 方法中,首先是高維度干預變量(treatment)的隱變量 z(latent variable z)的學習,即使用變分自編碼器(VAE)進行學習;然后是權重函數(shù) w(x,z)的學習,通過樣本重加權的方式對 x 和 z 之間進行去相關(decorrelation);最后在重加權的相關分布下直接使用回歸分析模型(regression model),就能得到一個比較理想的策略個體效果預測模型。
上圖是新方法 VSR 的實驗驗證,是在一些場景下,通過 Recsim 模擬器生成部分數(shù)據(jù),以及部分人工模擬的數(shù)據(jù),進行驗證??梢钥吹?,在不同的 p 的取值下,VSR 的性能都相對比較穩(wěn)定,相比其他方法有了很大的提升。相關論文發(fā)表在 NeurIPS 2020 [3]。
4、策略優(yōu)化策略優(yōu)化和前面兩種的預測評估是有本質(zhì)性區(qū)別的。預測評估都是提前給定一個策略(policy)或者個性化的干預(individual treatment),去預估最終的結(jié)果。策略優(yōu)化,也叫策略學習,目標只有一個結(jié)果變大。比如收益要增長,應該施加什么樣的干預。
如果現(xiàn)在有一個反事實的個體級別的預測模型 f,即策略個體效果預測模型 f,也就是給定xi和ti,就可以估計出來對應的結(jié)果,那么就可以對 T 進行遍歷,t 取什么值時,f 的值最大。就相當于構(gòu)造一個比較好的預測空間,在預測空間中“打哪指哪”。
但把策略優(yōu)化問題退化為策略個體效果預測模型的構(gòu)建,是有問題的。策略個體效果預測的目標,如前所述,實際上是相當于給定了一個干預,希望反事實預測出來的情況與真實情況的誤差盡量比較小,并且對于所有給定的干預,都希望比較準確。策略優(yōu)化的目標,是找到的pf點離真實情況上帝視角下的最優(yōu)決策的結(jié)果之間的距離越小越好,并不是一個全空間的策略個體效果預測的問題,而是能不能找到離最優(yōu)點比較近的區(qū)域,以及能不能準確地預測最優(yōu)點。策略優(yōu)化和策略個體效果預測在目標上是不一樣的,存在很明顯的差別。
如上圖中的案例圖所示,橫軸是不同的干預(treatment),綠線是上帝視角下的真實函數(shù),反映某個干預下真實的結(jié)果;紅線和藍線反映的兩個預測模型下的結(jié)果。從策略個體效果預測的評價角度來看,很顯然藍線是優(yōu)于紅線的,藍線離綠線的總體偏差,遠小于紅線離綠線的總體偏差。但從最優(yōu)決策的角度來看,紅線的最優(yōu)結(jié)果和上帝視角的綠線的最優(yōu)結(jié)果更接近,相應的干預也更接近,而藍線的明顯要更遠。因此一個更好地策略個體效果預測模型,不一定能夠得到一個最優(yōu)的決策;并且在真實的場景下,數(shù)據(jù)量通常是不充分的,在全空間下去做優(yōu)化,還是從結(jié)果的角度僅在一個子區(qū)域里做優(yōu)化,優(yōu)化的效果和力度是不一樣的。
因此提出了策略優(yōu)化的新方法OOSR,目的是加強結(jié)果比較好的干預區(qū)域的預測力度和優(yōu)化力度,而不是在全空間去做優(yōu)化。因此在做優(yōu)化時,在做面向結(jié)果的加權(outcome-oriented weighting)時,當前的干預離給定的已經(jīng)訓練下的最優(yōu)解的距離越近,則優(yōu)化力度更大。
上圖是 OOSR 的實驗驗證,可以看出,從各個角度上提升都非常明顯,有幾倍的提升,并且變化了 selection bias 的強度后,效果也依舊非常好。相關論文發(fā)表在 ICML 2022 [4]。
5、反事實推理總結(jié)不管是做策略評估,還是策略優(yōu)化、策略個體效果預測,實際上都是在利用因果關系(Causality),來對決策了解更多,讓決策表現(xiàn)更好,或者讓決策變得更加個性化。當然針對不同的場景,還有很多開放性的問題。
三、可信智能決策中的復雜收益在研究復雜收益,即:
時,考慮這樣一個場景,比如推薦系統(tǒng),希望推薦的商品或信息等用戶都會購買或點擊,同時也會實施一些刺激,比如降價,或進行紅包回饋等等,有很多類似的商業(yè)運營策略,雖然短期內(nèi)銷量提高了,提升效果很顯著,但從長期看并沒有非常顯著的變化,也就是商業(yè)上的很多刺激,并不是把不想買的變成想買的,而是本來一個月總需求量是 4 件,這次降價就一次性把 4 件都買完了。因此在做模型優(yōu)化時,不能只考慮短期收益,要兼顧短期收益和長期收益,共同去優(yōu)化策略。
要想兼顧短期和長期收益,共同優(yōu)化策略,有兩個非常重要的方面。第一,要對消費者的選擇模型有比較深入的理解。當給定一個用戶時,是沒有辦法得到真實的消費者選擇模型的,需要通過研究和挖掘的方式不斷地探索,一個是探索消費者選擇模型,另一個就是探索在消費者選擇模型下怎么樣最大化長期收益和短期收益,以及兩者的平衡。在這個方面的工作如上兩張圖所示,就不展開講了。
從最后的效果上來看,如上圖所示,在很多真實場景都有顯著的收益提升。相關論文發(fā)表在 NeurIPS 2022 [5]。
四、可信智能決策中的預測公平性如果預測要參與到?jīng)Q策中,特別是面向社會性的決策,一定要兼顧預測的公平性。
關于公平性,傳統(tǒng)的做法有 DP 和 EO,要求男女的接受概率是相等的,或者對于男女的預測能力是一樣的,都是比較經(jīng)典的指標。但 DP 和 EO 并不能從本質(zhì)上解決公平性的問題。
比如在大學錄取的案例中,理論上各個系男生和女生的錄取率應該都是一樣的,但實際總體上會發(fā)現(xiàn)女生的錄取率偏低,實際上這是一種辛普森悖論。大學錄取本質(zhì)上是一個公平的案例,但是 DP 的指標檢測出來,會認為不公平,實際上 DP 并不是一個非常完美的公平性指標。
EO 模型本質(zhì)上確實是性別參與了決策,但在一個不公平的場景下,如果對于男性和女性都有一個完美預測因子,就認為是公平的。這就說明 EO 的鑒別率是不夠的。
2020 年提出了有條件的公平性(conditional fairness)這一概念。有條件的公平性并不是要絕對地去保證最終結(jié)果和敏感因素(sensitive attributes)獨立,而是給定某些公平性變量(fair variable),最終結(jié)果和敏感因素獨立,就認為是公平的。比如專業(yè)選擇,是公平的,是一個 fair variable,因為是學生主觀能動性可以決定的,不存在公平性問題。
這樣做帶來了非常多的好處。從預測的角度來講,公平性和預測之間實際上就是一種權衡,也就是公平性要求越強,可用的預測變量(predictive variable)就會越少。比如在 EO 的框架下,只要一個變量是在從性別到結(jié)果決策之間的鏈路上,是都不能用的,用了就會導致很多變量實際上預測效率非常高,但是不能做預測。但在有條件公平性下,給定了一個公平性變量,不管是不是在鏈路上,都可以保證預測效率可用。
在此框架下,設計和提出了 DCFR 算法模型,如下三圖所示。
下圖 DCFR 算法的實驗驗證。從整體上看,DCFR 算法能夠取得更好的預測和公平性的折中,從帕雷托最優(yōu)的角度上來講,左上的曲線實際上是更優(yōu)的。相關論文發(fā)表在 KDD 2020 [6]。
五、可信智能決策中的可監(jiān)管決策最后是可信智能決策中的可監(jiān)管決策。
現(xiàn)在的平臺有很多個性化定價機制。本質(zhì)上來講,個性化定價是可以最大化社會的總效率和總剩余的。但是在某一些極端情況下,商家會把所有的剩余都拿走,而不給用戶留一分的剩余,這是我們不希望看到的。
從總體上看,就是要設計出一種策略,可以使得在社會總剩余不受太大影響的情況,商家讓渡一部分可視為財富的剩余給消費者。
最終設計出了一種調(diào)控手段來解決這個問題,如下圖所示。也就是比如同一個商品,最高價和最低價之間不能超過一個 ,或者不能超過一定的比例。理論上可以證明這樣設計的規(guī)則可以實現(xiàn)如前所述的優(yōu)化目標。
在此種場景下,本質(zhì)上是通過對收益函數(shù)增加一些約束,使得在做決策的時候必須要有另一個層面的考慮。因此在這個體系下,可以把監(jiān)管相關的一些策略或者工具加入進來。
六、可信智能決策的總結(jié)以上就是在可信智能決策的這樣一個框架下,在反事實推理、復雜收益、預測公平性和可監(jiān)管決策各個單點上做的一些嘗試??傮w而言,決策的想象空間遠比預測更大。在決策的領域里,還有很多和我們生活、商業(yè)息息相關的開放性問題值得探究。相關論文發(fā)表在WWW 2022 [7]。
PS:本文涉及的很多技術細節(jié),可以參看崔鵬老師團隊近期在可信智能決策方向上所發(fā)表的論文。
七、參考文獻[1] Jon Kleinberg, Jens Ludwig, Sendhil Mullainathan, Ziad Obermeyer. Prediction Policy Problems. AER, 2015。
[2] Hao Zou, Kun Kuang, Boqi Chen, Peng Cui, Peixuan Chen. Focused Context Balancing for Robust Offline Policy Evaluation. KDD, 2019。
[3] Hao Zou, Peng Cui, Bo Li, Zheyan Shen, Jianxin Ma, Hongxia Yang, Yue He. Counterfactual Prediction for Bundle Treatments. NeurIPS, 2020。
[4] Hao Zou, Bo Li, Jiangang Han, Shuiping Chen, Xuetao Ding, Peng Cui. Counterfactual Prediction for Outcome-oriented Treatments. ICML, 2022。
[5] Renzhe Xu, Xingxuan Zhang, Bo Li, Yafeng Zhang, Xiaolong Chen, Peng Cui. Product Ranking for Revenue Maximization with Multiple Purchases. NeurIPS, 2022。
[6] Renzhe Xu, Peng Cui, Kun Kuang, Bo Li, Linjun Zhou, Zheyan Shen and Wei Cui. Algorithmic Decision Making with Conditional Fairness. KDD, 2020。
[7] Renzhe Xu, Xingxuan Zhang, Peng Cui, Bo Li, Zheyan Shen, Jiazheng Xu. Regulatory Instruments for Fair Personalized Pricing. WWW, 2022。
標簽:
一、一種可信智能決策框架首先和大家分享一種可信智能決策框架。1、比預測更重要的決策在實際的很多場景中
2023-05-04智通財經(jīng)獲悉,香港恒生指數(shù)開盤跌0 02%。早盤恒指迅速沖高,此后全天呈窄幅震蕩走勢。截至收盤,恒生指數(shù)
2023-05-04美股異動|蘋果盤前跌1 24%將于盤后發(fā)布財報:蘋果(AAPL US)盤前跌1 24%,報165 37美元。蘋果將于5月4日美股
2023-05-04馬來西亞林肯大學碩士學費及申請條件由MBA考試欄目提供,查找更多考試報名資訊、準考證打印、成績查詢或馬來
2023-05-04“五一”假期日均125 3萬人次出入境,主流媒體,山西門戶。山西新聞網(wǎng)是經(jīng)國務院新聞辦審核批準,由山西...
2023-05-04他是一名打私警察,奮戰(zhàn)在廣東西江水域,打掉了一批又一批的走私團伙;在執(zhí)行任務中負傷并不幸截肢后,他憑
2023-05-041、為有效保護和傳承非物質(zhì)文化遺產(chǎn),建立科學的非物質(zhì)文化遺產(chǎn)保護制度,規(guī)范非物質(zhì)文化遺產(chǎn)的申報評定和
2023-05-04朗瑪信息在互動平臺表示,公司基于積累的醫(yī)學及健康數(shù)據(jù)資源和相關技術基礎,已開始探索醫(yī)療健康垂直領域的
2023-05-04和而泰近期接受投資者調(diào)研時表示,基于公司研發(fā)能力儲備和現(xiàn)有客戶資源渠道,公司在電池管理系統(tǒng)(BMS)、
2023-05-04本文內(nèi)容是由小編為大家搜集關于天天紅彩票app最新,以及天天紅彩票平臺網(wǎng)址的資料,整理后發(fā)布的內(nèi)容,讓我
2023-05-04【美駐華大使表達“希望與中方對話”】美駐華大使表達“希望與中方對話”,網(wǎng)友:聽其言,更要觀其行!
2023-05-04據(jù)報道,近日,英國國防部投入6 56億英鎊(約合8 16億美元),加速推進“全球作戰(zhàn)空中計劃”中“暴風...
2023-05-04日前,公募基金一季報已全部披露完畢,公募基金持倉變化以及顯現(xiàn)出的市場“新動向”也隨之浮出水面。數(shù)...
2023-05-04及時應對,“一日一圖”調(diào)運力。
2023-05-04日前,為期一個月的國家大劇院第八屆“中國交響樂之春”正式落幕。在“新時代號角”的主題下,來自全國...
2023-05-04緩緩行走在嘉定的大街小巷 在某個不經(jīng)意的轉(zhuǎn)角 就能和爛漫春光撞個滿懷 這一站浪漫 一簇簇粉色的薔薇
2023-05-04一、游客手機掉西湖被要1500元打撈費5月2日,杭州有游客發(fā)布視頻稱,手機掉到西湖里,被一位衣服上寫著...
2023-05-04讀特客戶端·深圳新聞網(wǎng)2023年5月4日訊(晶報記者柯季陳馥玉通訊員陳友安姜帆張佳露)為加快推進保障性...
2023-05-044月29日,示范區(qū)管委會副主任、常務副市長張宏義調(diào)研假期安全生產(chǎn)工作。張宏義一行先后到沁園丹尼斯、市二
2023-05-04兩大綜合家電巨頭,美的集團和格力電器已先后完成了2022年年報和2023年一季報披露。
2023-05-04?5月2日,在東方市竹金溝公園項目建設現(xiàn)場,工人們緊扣工程節(jié)點抓緊施工,力爭項目今年6月底竣工交付。
2023-05-041、首先要先把臟兮兮的杯子用自來水或者熱水沖洗一下,把易清洗掉的污漬稍微清洗一下,這樣就可以有針對性
2023-05-04雪魄梅魂粵語版,雪魄這個很多人還不知道,現(xiàn)在讓我們一起來看看吧!1、正章帝是玉潤。2、清河死時挺年輕的
2023-05-041、我們知道定制版的手機一般都是用專門的電話卡,但是給手機換電話卡是很麻煩的。電信iPhone6如何使用移動
2023-05-041、2021年中南林業(yè)科技大學招生計劃(湖南)2、序號專業(yè)層次學費科類批次備注計劃3、(元 年)4、1土地資源管
2023-05-041、花牙子是用于倒掛楣子兩端角的一種裝飾構(gòu)件,有用欞條拼結(jié)而成,也有用木板雕刻而成,形似如雀替,不過
2023-05-04五一假期已近尾聲,據(jù)統(tǒng)計,在今年五一全國最熱十大景點中,杭州西湖游客量高居榜首。這已不是杭州首次獲此
2023-05-031、是因為你在磁盤管理里重新分過區(qū)。2、里面默認名稱‘新加卷’你需要重新命名一下。3、自然就不會再有新
2023-05-031、順著頭套下去最好是在最硬的時候套能緊貼陰頸然后就是頭上留有一點氣泡的空間是有用滴就不多介紹了友情
2023-05-03智通財經(jīng)獲悉,據(jù)香港金管局5月3日消息,香港金管局總裁余偉文在《匯思》文章中表示,隨著美國加息,全球流
2023-05-03(祁增蓓馬曉光)記者3日從中國鐵路青藏集團有限公司(以下簡稱“青藏集團公司”)獲悉,青藏鐵路西寧至格爾...
2023-05-031、房水作用:對維持角膜和晶體的正常生理功能,保持它們的透明性,起著十分重要的作用。2、房水內(nèi)有了有害
2023-05-03今天來聊聊關于女媧造人課文原文故事,女媧造人課文原文的文章,現(xiàn)在就為大家來簡單介紹下女媧造人課文原文
2023-05-03敦煌市鳴沙山月牙泉景區(qū)游人如織。張曉亮攝“駱駝紅綠燈”讓景區(qū)交通更有序。張曉亮攝“駱駝紅綠燈”讓...
2023-05-03新湖南,主流新媒體,移動新門戶。-分享自@新湖南
2023-05-03點擊下方卡片,關注“CVer”公眾號AI CV重磅干貨,第一時間送達今天Amusi看到這么一則新聞: 今年高校畢業(yè)
2023-05-031、秋思張籍洛陽城里見秋風,欲作家書意萬重。2、復恐匆匆說不盡,行人臨發(fā)又開封描寫秋天的詩:《山居秋暝
2023-05-03詳情請見:https: content-static cctvnews cctv com snow-book index html?toc_style_id=
2023-05-031、延吉街道少數(shù)民族志愿者服務隊是由楊浦區(qū)少數(shù)民族志愿服務隊領導下的志愿團體。2、成立于2015年10月5日。
2023-05-03如果您喜歡這篇文章,請您分享到微信朋友圈!如果您想要獲得更多精彩內(nèi)容,請您點擊上方藍字“管理系統(tǒng)...
2023-05-03潮新聞記者俞劉東五一假期,杭州西湖游人如織。5月1日,翠光亭附近的一家小店被游客投訴了。而也是這一個投
2023-05-032023年4月29日11時20分,沈陽公安交警高速一大隊民警呂曉東在沈海高速公路1公里處疏導交通時,接到群眾求助
2023-05-03數(shù)十萬法國人走上街頭示威抗議活動正在擾亂法國經(jīng)濟
2023-05-031、幫會規(guī)矩。2、如果做了無可挽回的錯事,請求對方恕罪,就得用利刃在自己的身體上對穿三個窟窿,此之...
2023-05-031、孫玉蓮。2、濟南市保健辦公室副主任。文章到此就分享結(jié)束,希望對大家有所幫助。
2023-05-03前篇此文主要介紹如何把window的鼠標指針更改成Mac的鼠標指針點https: img02 mockplus cn image 2020-09-1
2023-05-03對于word里如何調(diào)整表格行高這個問題感興趣的朋友應該很多,這個也是目前大家比較關注的問題,那么下面小好
2023-05-031、簡介:眾化(杭州)科技有限公司是一家專業(yè)從事精細化學品B2B交易平臺建設的專業(yè)技術企業(yè)。2、法定代表
2023-05-031、前言小時候最愛吃媽媽煮的白菜粉絲。2、喜歡那爽滑筋道的口感,配上白菜芯、瘦肉絲、蛋皮、香菇加少許高
2023-05-03今天來聊聊關于達則兼濟天下窮則獨善其身是什么意思兼讀音,達則兼濟天下窮則獨善其身是什么意思的文章,現(xiàn)
2023-05-021、金山公司推出的一款辦公軟件。2、可與微軟公司的OFFICE相媲美。3、可惜現(xiàn)在使用率越來越低了。4、金山殺
2023-05-02?抖音短視頻現(xiàn)在屬于比較火的形式,但凡大家拿著手機就會忍不住拍短視頻,現(xiàn)在短視頻發(fā)展的越來越好,很多
2023-05-02黃金虛晃一槍,行情還是跌勢,建議繼續(xù)順勢做空,設4美金損即可?。?!熱烈慶祝五一勞動節(jié),也感謝粉絲們的
2023-05-02據(jù)澳大利亞廣播公司2日報道,澳大利亞央行(澳聯(lián)儲)當天下午宣布,將現(xiàn)金利率再提高0 25個百分點至3 85%。報
2023-05-021、電焊證的真假不能在網(wǎng)站上檢測只能持物件到安監(jiān)局當面檢測方知真?zhèn)?。本文到此分享完畢,希望對大家有?/p> 2023-05-02
1 問:什么是甲狀腺結(jié)節(jié)?答:甲狀腺位于頸部中間。甲狀腺結(jié)節(jié)是生長在甲狀腺中的圓形或橢圓形的東西。甲狀
2023-05-02美財長說美或最早6月1日出現(xiàn)債務違約---新華社華盛頓5月1日電美國財政部長耶倫5月1日警告說,如果國會不盡
2023-05-02【ITBEAR科技資訊】5月2日消息,據(jù)美國聯(lián)邦通信委員會(FCC)網(wǎng)站公示,谷歌PixelFold折疊屏手機已通過FCC認
2023-05-02據(jù)香雪制藥(300147)消息,為了滿足市場需求,五一假期不停歇,香雪制藥(300147)生產(chǎn)線開足馬力生產(chǎn)抗病毒口
2023-05-02五月的第一天,國際油價下挫。截至5月1日收盤,紐約商品交易所6月交貨的輕質(zhì)原油(下稱“WTI原油”)期...
2023-05-02在剛結(jié)束的上海車展,新能源汽車帶了很多新鮮的體驗,讓我們看到汽車未來發(fā)展的方向,現(xiàn)在再回味幾款有創(chuàng)新
2023-05-02辛頓在接受采訪時稱,他離開谷歌的原因,是因為他越來越擔心人工智能可能帶來的問題,特別是當它被用于武器
2023-05-02河北:全力保障電動汽車“五一”高速出行---“五一”假期來了,今年出行人數(shù)呈現(xiàn)大幅增長,河北省內(nèi)跨城...
2023-05-02金茂悅是高檔樓盤嗎:大興金茂悅是高檔樓盤,占地面積約48589平方米,建筑面積約106896平方米,小區(qū)容積率
2023-05-02今日永州訊(江華特約記者黃春華)“五一”假期,在湘江鄉(xiāng)的千年瑤寨桐沖口村,游人如織、人氣高漲,僅假...
2023-05-02格隆匯5月2日丨比亞迪股份公布2023年4月產(chǎn)銷快報,當月新能源汽車銷量達210,295輛,同比增長98 31%。其中乘
2023-05-02奧地利兩列貨運列車相撞致少量危險品泄漏
2023-05-02智通財經(jīng)APP獲悉周一優(yōu)步UBERUS股價走高截至發(fā)稿該股漲超47報32545美元優(yōu)步將于美東時間5月2日盤前發(fā)布財報
2023-05-02今天來聊聊關于什么是供應鏈融資支付,什么是供應鏈融資的文章,現(xiàn)在就為大家來簡單介紹下什么是供應鏈融資
2023-05-02為確保“五一”期間安全生產(chǎn)形勢穩(wěn)定,有效預防和減少生產(chǎn)事故的發(fā)生,保障轄區(qū)安全生產(chǎn)狀況持續(xù)穩(wěn)定,...
2023-05-02能成為作家的人,或許骨子里都是多情的,因為只有豐富的情感經(jīng)歷,才能將這切身感受融入一個個故事,生成筆
2023-05-01近日,江蘇省文化和旅游廳公布了江蘇省鄉(xiāng)村旅游業(yè)態(tài)創(chuàng)新示范產(chǎn)品和示范項目,大豐恒北梨鄉(xiāng)非遺文創(chuàng)集市成功
2023-05-01客流量連續(xù)3天創(chuàng)歷史新高武漢地鐵夜間3小時內(nèi)加開48趟臨客送乘客返程---4月30日,武漢地鐵線網(wǎng)客流再創(chuàng)新高
2023-05-011、字有什么組詞:暑假、避暑、酷暑、溽暑、小暑、伏暑、炎暑、防暑、大暑、暑熱、寒暑、暑天、中暑、盛暑
2023-05-011、據(jù)聯(lián)合國人口基金預測,2011年10月30日世界人口即將達到70億。2、2011年10月31日凌晨前2分鐘,作為全球
2023-05-011、佩奇PeppaPig喬治George豬媽媽MummyPig豬爸爸Daddypig小豬佩奇是一個可
2023-05-011、新湖財富投資管理有限公司是2011-09-15在北京市石景山區(qū)注冊成立的其他有限責任公司,注冊地址位于北京
2023-05-011、首先我們二技能向前丟去,然后按住大招,通過方向鍵調(diào)整位置向二技能筆勢方向沖去。2、觸碰到二技能會刷
2023-05-01據(jù)報道,蘋果的AR頭顯正處于 "最后沖刺 "和 "供應鏈交付階段 ",將如期在6月份的WWDC上亮相。報道稱,
2023-05-01隨著美聯(lián)儲本周可能發(fā)出幾十年來最激進加息周期即將結(jié)束的信號,投資者正在大舉押注美元下跌。美國商品期貨
2023-05-011、帶著倉庫到大明(中后期就不怎么使用倉庫了)帝國崛起(古代現(xiàn)代雙穿,后期也是依靠自己逆天)我的明朝
2023-05-011、打開PS,點擊文件——>導入;如果彈出dynamiclink不可用,則表示功能不可用,需要進行下一步修復與安裝。2、
2023-05-01暗黑破壞神4是一款有著豐富內(nèi)容的游戲,游戲中可以探索的地方有很多,所以很多玩家在探索游戲的過程中遇到
2023-05-012023年上海市普通高中學業(yè)水平考試的5月等級性考試為5月6日和5月7日,科目為化學、思想政治、物理、歷史、
2023-05-01天藍的底色配以雪白的玉飛鳳標識,在崇安大廈樓下,新增加的共享車位讓人一目了然。近日,為有效治理中心城
2023-05-01“快看!這個花開得真好看!”“來,我站在這個花下面,幫我拍張照。”“幫我在這里拍張照片。”這兩天...
2023-05-01盡管其他球隊都已經(jīng)開始了半決賽,但是勇士和國王的這場戰(zhàn)役還在激烈進行中。隨后克萊連續(xù)得分,勇士終于反
2023-05-01金融界基金05月01日訊富國中證銀行ETF基金04月28日上漲1 16%,現(xiàn)價1 129元,成交2122 85萬元。當前本基金場
2023-05-01游客在江蘇省蘇州市吳江區(qū)的同里古鎮(zhèn)游玩?! 堜h攝(人民視覺) 市民在四川省宜賓市翠屏區(qū)李莊古鎮(zhèn)拍
2023-05-011、孫昕,男,漢族。2、1975年4月出生,群眾,碩士研究生學歷。3、現(xiàn)任北京中科金財科技股份有限公司事業(yè)部
2023-05-01網(wǎng)紅痞幼自從與陸文臣分手后,就一心只干事業(yè),最近接連更新視頻,心情也好了起來。4月30日,有狗仔爆料,
2023-05-011、一個數(shù)組只有3個元素,那么當你引用第4個元素時就超出索引范圍了。2、同理,本來只有二維,三維索引
2023-05-01在本賽季的意甲聯(lián)賽當中,那不勒斯的表現(xiàn)可以說是獨一檔的存在,雖然在后半程統(tǒng)治力出現(xiàn)了一定的下滑,但是
2023-04-30公司安全存儲業(yè)務方向研制的固態(tài)硬盤相關產(chǎn)品技術也已在航空領域得以應用
2023-04-3000:28潮新聞記者葉怡霖“五一”小長假第二天,2023年度第一窩西湖小鴛鴦出窩啦,就像是專程迎接來自四面...
2023-04-301、1 不僅;何止。2、2 無異于,如同。3、3 只有,不過。4、4 不如,比不上。5、祝你好運。本文到此分享完畢
2023-04-30五一,一個繁花似錦的節(jié)日。在這個以 "勞動 "命名的節(jié)日里,各行各業(yè)的勞動者依然在用自己智慧和雙手...
2023-04-3001:38日常有人非常注意飲食,有些老年人甚至不敢沾一點油膩,但血脂還是居高不下,這是為什么呢?揚子晚報
2023-04-301、作者:賀新輝主編定價:198元書號:9787802033757開本:16出版社:中國婦女出版社。本文到此分享完
2023-04-301、鏈接:提取碼:37te《宦??v橫》作者:陳寧(又名萬馬犇騰)類別:官場歷史小說。本文到此分享完畢,希望
2023-04-30Copyright © 2015-2022 太平洋水產(chǎn)網(wǎng)版權所有 備案號:豫ICP備2022016495號-17 聯(lián)系郵箱:93 96 74 66 9@qq.com