申明:僅代表個(gè)人觀點(diǎn),不代表任何組織與單位
這幾天有報(bào)道說阿茲夫定的三期臨床試驗(yàn)公布,顯著縮短核酸轉(zhuǎn)陰時(shí)間。這個(gè)藥之前寫過很多,有效性極為可疑,安全性上的遺傳、生殖毒性問題更無法解決(詳見二條)。
但很多人還在問,所以就去看了所謂顯示有效性的巴西三期臨床試驗(yàn),其實(shí)根本談不上顯示有效性,部分內(nèi)容也與之前相關(guān)藥企IPO文件里提到的其它臨床試驗(yàn)結(jié)果沖突。此藥能上架就已荒唐,如果你有(不)幸拿到阿茲夫定,扔了算了。
(資料圖片)
1. 沒有達(dá)到主要終點(diǎn)的“成功”
阿茲夫定巴西的三期臨床試驗(yàn)公布,國內(nèi)媒體大言不慚地說安全有效:
好像試驗(yàn)非常成功,而且有意思的是說成了巴西的一項(xiàng)三期臨床試驗(yàn),同時(shí)涉及輕癥與中癥感染者。實(shí)際上這明明就是兩項(xiàng)研究,預(yù)印版論文也是兩篇。
輕癥的[1]:
中癥的[2]:
別看兩個(gè)標(biāo)題就Mild(輕癥)和Moderate(中癥)這一字之差,差點(diǎn)也讓我看花了眼,但兩個(gè)試驗(yàn)在Clinicaltrial.gov上分別編號(hào),是不同的試驗(yàn)。連通稿買的都不嚴(yán)謹(jǐn),不得不佩服,當(dāng)然去看了這兩篇論文,按其中的學(xué)術(shù)嚴(yán)謹(jǐn)程度以及寫作水平,通稿發(fā)不對(duì)也不讓人意外。
媒體報(bào)道更讓人震撼的是,報(bào)道內(nèi)容里直接顯示了試驗(yàn)主要終點(diǎn)未達(dá)到,居然還能說是證明有效。例如輕癥的試驗(yàn),媒體報(bào)道里的主要重點(diǎn)都寫明了:
是出院時(shí)病情量表各級(jí)比例,這個(gè)有區(qū)別嗎?報(bào)道里直接一張圖都顯示沒有區(qū)別:
主要終點(diǎn)都沒達(dá)到,也能說是成功?
中癥那個(gè)也一樣。媒體報(bào)道里也說明了主要重點(diǎn)是什么:
WHO病情改善一個(gè)級(jí)別的患者比例,這個(gè)終點(diǎn)達(dá)到了嗎?這里阿茲夫定耍了個(gè)心機(jī),預(yù)印版論文里承認(rèn)了出院時(shí)除了1位退出和7位惡化,其他人都是WHO評(píng)分里最低的0或1分。也就是說都改善了,主要重點(diǎn)同樣沒有區(qū)別??蔀槭裁凑f阿茲夫定耍了個(gè)心機(jī)呢?因?yàn)樗f阿茲夫定組出院時(shí)最終評(píng)分是0.02 ± 0.15(對(duì),最低評(píng)分是0,但它能做出0.02方差0.15),比安慰劑組的0.11 ± 0.31低。
這個(gè)最終評(píng)分差異到底在哪里?看了下原論文:
安慰劑組1分的比阿茲夫定多。那1分和0分是什么區(qū)別?兩個(gè)都是無癥狀,只是1分的核酸還沒轉(zhuǎn)陰。就這么點(diǎn)區(qū)別??晌覀冎揽祻?fù)者很長時(shí)間可能因病毒尸體檢測出核酸陽性。這種差異根本就沒有意義。后面也會(huì)重點(diǎn)說阿茲夫定強(qiáng)調(diào)的核酸轉(zhuǎn)陰差距為什么不靠譜。
此外,這個(gè)試驗(yàn)只招募了180人,最后完成試驗(yàn)的是172人,7個(gè)惡化進(jìn)入ICU(6個(gè)死亡),1位退出,這8人都沒放入上述分析,其中除了退出的和一位心臟驟停死亡的都完成了治療。把這些人放入分析,還能有區(qū)別嗎?要知道WHO評(píng)分里死亡可是10分。
難不成現(xiàn)在我們判斷阿茲夫定的有效性標(biāo)準(zhǔn)是,吃了后好了的都好了,所以就有效,沒好的直接忽略?要是用這標(biāo)準(zhǔn),要找出個(gè)沒用的藥也不容易啊。
兩個(gè)試驗(yàn)主要終點(diǎn)都沒達(dá)到,居然能說顯示有效,只能讓人覺得要去查查字典,看看“有效”二字的定義是不是改過了。
2. 核酸轉(zhuǎn)陰靠譜嗎?
主要終點(diǎn)都錯(cuò)過,但不妨礙阿茲夫定愛好者們拉出“加速核酸轉(zhuǎn)陰”的賣點(diǎn)來宣傳。其實(shí)這從兩篇預(yù)印版論文的標(biāo)題都能看出來,都是通過載毒量來評(píng)估有效性。
兩篇論文都宣稱阿茲夫定顯著縮短了感染患者核酸轉(zhuǎn)陰時(shí)間,在輕癥的試驗(yàn)里,阿茲夫定組第一次轉(zhuǎn)陰是5.55天,安慰劑組是8.27天;中癥的試驗(yàn),阿茲夫定組第一次轉(zhuǎn)陰6.24天,安慰劑組是7.94天。但這些天數(shù)是平均值還是中位值?新聞稿里沒說,也正常,因?yàn)橹挥休p癥的論文里說了是平均,而中癥雖是獨(dú)立的文章,卻一字不提。所以我說兩篇論文的嚴(yán)謹(jǐn)程度令人震撼。不過別急,還有更震撼的,現(xiàn)在繼續(xù)說核酸轉(zhuǎn)陰。
核酸轉(zhuǎn)陰是用RT-PCR來判斷,就是劃一個(gè)CT值的標(biāo)準(zhǔn),CT值越高,載毒量越低。核酸陰性即RT-PCR的CT值低于設(shè)定的陰性標(biāo)準(zhǔn)了。然后看中癥試驗(yàn)論文里的CT值比較:
兩個(gè)組有區(qū)別嗎?方差范圍互相重合,居然能說阿茲夫定轉(zhuǎn)陰時(shí)間更快?論文說阿茲夫定是6.24天轉(zhuǎn)陰,安慰劑組7.94天,去看5、7、9這三個(gè)采樣點(diǎn),兩組CT值有區(qū)別嗎?還能一個(gè)轉(zhuǎn)陰一個(gè)沒轉(zhuǎn)陰?
另外這里核酸轉(zhuǎn)陰的標(biāo)準(zhǔn)是什么?從文章的方法來看,CT值大于30.5是陽性。第7天的時(shí)候,阿茲夫定組方差范圍的上限連CT值30的毛都沒碰到,能算出來核酸轉(zhuǎn)陰時(shí)間是6.24天?就算最快轉(zhuǎn)陰時(shí)間都不符合這張圖啊。
輕癥試驗(yàn)用的核酸檢測試劑盒與中癥的文章一模一樣,但核酸陰性的標(biāo)準(zhǔn)成了CT大于37。不要問我為什么,因?yàn)槲乙膊恢?,只能說是量子核酸。這是輕癥的CT值變化圖:
雖然說紅色的阿茲夫定組和藍(lán)色的安慰劑組在CT值上有區(qū)分,阿茲夫定在3、5、7三個(gè)采樣點(diǎn)都是CT值更高,可是連30都沒超過,離37的轉(zhuǎn)陰標(biāo)準(zhǔn)更是十萬八千里,怎么就得出阿茲夫定輕癥組5.55天轉(zhuǎn)陰呢?
對(duì)了,輕癥這幅圖的圖標(biāo)是Ciral load,都不是病毒載量,是Ciral載量,不過這仍不是我說的令人震撼的地方,繼續(xù)往下看,最后再揭曉。
這些核酸轉(zhuǎn)陰或載毒量比較,還有一個(gè)不靠譜的地方在于不同的采樣時(shí)間點(diǎn),收集的樣本數(shù)不一樣。比如輕癥試驗(yàn)里:
紅框里的是每個(gè)采樣時(shí)間點(diǎn)的采樣人數(shù),這個(gè)輕癥試驗(yàn)招募了312人,但31人在完成治療前退出了(同樣,我們不知道為什么這31人退出了,另外阿茲夫定的治療是不超過14天,未完成治療是什么概念?是不是也吃了一段時(shí)間,有沒有采樣?這些還是不知道)。完成治療的281人采樣,可隨著時(shí)間進(jìn)行,采樣的受試者越來越少。這種情況下,比較出來的載毒量差異是否還有意義?
為什么有的人沒采到樣?兩組里分布是否平均?兩個(gè)試驗(yàn)還專門用ddPCR來檢測載毒量,可一樣受到采樣人數(shù)變化的影響。
反正,阿茲夫定愛好者們眼里的證明阿茲夫定有效安全的巴西三期臨床試驗(yàn),主要終點(diǎn)沒有達(dá)到。所謂的核酸轉(zhuǎn)陰顯著縮短,按兩篇論文里給出的具體數(shù)據(jù),連這轉(zhuǎn)陰時(shí)間都不靠譜。
3. 與過往試驗(yàn)矛盾
這也不是阿茲夫定第一次炒作。說這次試驗(yàn)證明有效的人,為何不去看看阿茲夫定過往試驗(yàn)的結(jié)果,比較一下?比如阿茲夫定還有在中國的臨床試驗(yàn),曾在藥企IPO文書中提到過[3]。
為什么要再看一下這個(gè)中國的試驗(yàn)?因?yàn)檫@個(gè)從2020年6月做到了2022年3月的輕癥與普通型新冠試驗(yàn),主要終點(diǎn)恰好是受試者服藥后第7與14天時(shí)的載毒量。巴西的試驗(yàn)不是說顯著降低載毒量嗎?那我們就看看這種說法在以載毒量為主要標(biāo)準(zhǔn)的試驗(yàn),是什么結(jié)果。
中國實(shí)際招募348人。完整數(shù)據(jù)沒有公布過,IPO文件描述有效性時(shí),加了一個(gè)前提——基線載毒量高于3^10,在這些高載毒量受試者中,第3、5、7天用藥組載毒量下降比安慰劑組更多:
那么問題來了,這載毒量高的受試者是多少人呢?這一標(biāo)準(zhǔn)是事先確定的,還是事后加入?如果是事后加入,是否存在偏倚(bias)呢?而且即使是在這不知道多少人的高載毒量組里,載毒量變化達(dá)到顯著差異的只有第5天。
根據(jù)這些描述可以推斷試驗(yàn)的主要終點(diǎn)——受試者第7與14天的載毒量,用藥組與安慰劑組沒有顯著差異,也就是說該試驗(yàn)還是沒有達(dá)到主要終點(diǎn)。
另外,IPO文件里也說了所有次級(jí)終點(diǎn)均未顯示顯著差異。那么次級(jí)終點(diǎn)里有什么呢?除了吸氧比例、肺炎變化等癥狀,還有核酸檢測轉(zhuǎn)陰時(shí)間與速率。
也就是說,巴西兩個(gè)試驗(yàn)里觀察到的核酸轉(zhuǎn)陰更快,在中國的試驗(yàn)里沒有觀察到。而且在以載毒量為主要終點(diǎn)的中國試驗(yàn)里,這個(gè)主要終點(diǎn)沒有達(dá)到。
以癥狀相關(guān)指標(biāo)為主要終點(diǎn)的兩個(gè)巴西臨床試驗(yàn),沒達(dá)到主要終點(diǎn),拿出不知怎么計(jì)算出來的核酸轉(zhuǎn)陰時(shí)間以及不知采樣人數(shù)為何不斷變動(dòng)的載毒量數(shù)據(jù)說有差異。可真的以載毒量為主要終點(diǎn)的中國臨床試驗(yàn)里,載毒量沒有達(dá)到終點(diǎn),核酸轉(zhuǎn)陰也沒有差異。
這種情況下,你覺得阿茲夫定值得相信嗎?如果還是相信,那只能說是真愛,韭菜愛鐮刀那種真愛。
4. 試驗(yàn)人數(shù)問題
巴西的兩個(gè)試驗(yàn),輕癥的是招募312人,中癥原計(jì)劃招募342人,后來改成180人。阿茲夫定藥企IPO文件里還提到中國和俄羅斯兩個(gè)試驗(yàn)。中國計(jì)劃招募342人,俄羅斯計(jì)劃招募314人。
這些試驗(yàn)的主要終點(diǎn)不一,中國的是載毒量下降,俄羅斯與巴西是癥狀緩解。可是無論什么終點(diǎn),如此少的計(jì)劃招募人數(shù)非常詭異。
有人可能會(huì)說,管它招募多少人,最后有效性指標(biāo)——臨床試驗(yàn)終點(diǎn)能做出統(tǒng)計(jì)意義上的區(qū)別不就行了?可在非常少的招募人數(shù)下做出顯著差異,意味著藥效要非常好,這樣用藥組與安慰劑組才能拉開足夠的差距。但前瞻性的三期臨床試驗(yàn),試驗(yàn)完成前——包括設(shè)計(jì)試驗(yàn)的時(shí)候,沒人知道藥效有多高。試驗(yàn)人數(shù)的確定,一般是在希望能有多大概率(統(tǒng)計(jì)檢驗(yàn)功效)確認(rèn)至少多高的有效性,這一基礎(chǔ)上去推算。
比如新冠疫苗的試驗(yàn),假設(shè)希望試驗(yàn)?zāi)苡?0%的把握確認(rèn)一個(gè)50%有效性的疫苗,可以回推需要多少病例,再根據(jù)一些感染率假設(shè),推算應(yīng)招募多少人以及試驗(yàn)需要做多久。
新冠藥物在試驗(yàn)設(shè)計(jì)階段,覺得只要招募三百多人就能確定有效性幾乎是匪夷所思。參考輝瑞與默克口服藥。在輕到中癥的高危人群三期臨床,輝瑞計(jì)劃招募約3000人,希望有1700人有數(shù)據(jù)做主要分析,默克計(jì)劃招募1550人[3-4]。這些都是基于希望有足夠的統(tǒng)計(jì)檢驗(yàn)功效去檢測50%降低重癥風(fēng)險(xiǎn),演算出來的需要的樣本量大小。最后兩家實(shí)際分析的數(shù)據(jù)量分別有2200多人與1400多人。
即使說這兩個(gè)藥檢測的降低重癥風(fēng)險(xiǎn)與阿茲夫定的臨床試驗(yàn)終點(diǎn)不同,那參考輝瑞口服藥在低危人群的EPIC-SR試驗(yàn),這里主要重點(diǎn)是癥狀持續(xù)改善,也招募了1440人[5]。國內(nèi)新冠單抗藥Brii-196/198,參與NIH的ACTIV-2試驗(yàn),確認(rèn)有效性是用藥組418人,安慰劑組419人[6]。
為什么阿茲夫定的研發(fā)方認(rèn)為300多人的試驗(yàn)就能驗(yàn)證藥物有效性?同行都是計(jì)劃招募一兩千人明確有效性時(shí),有人卻不斷設(shè)計(jì)300多人的臨床試驗(yàn),甚至改到180人后能繼續(xù)做出所謂的有效性,這值得警惕。
5. 遠(yuǎn)離渣藥
前文屢次提到阿茲夫定巴西臨床試驗(yàn)的兩篇論文不嚴(yán)謹(jǐn)程度令我震撼,現(xiàn)在就揭曉最讓我震撼的一點(diǎn)——是的,就算有怎么都讓我想不明白的轉(zhuǎn)陰時(shí)間,還有更震撼的:
這張截圖是巴西中癥那個(gè)臨床試驗(yàn)里的補(bǔ)充材料里截出來的。為什么讓我震撼,看一下圖里上半部分那個(gè)表,里面的人數(shù),阿茲夫定組143人,安慰劑組138人。我們說了中癥這個(gè)試驗(yàn)總共才180人入組,怎么會(huì)有這么多人?這個(gè)人數(shù)其實(shí)是輕癥那個(gè)試驗(yàn)里的分組人數(shù),第二個(gè)表格里阿茲夫定91人,安慰劑88人才是中癥的分組人數(shù)。
牛吧,兩篇論文居然數(shù)據(jù)能混到一起去。搞得我讀著讀著總覺得自己眼睛是不是花了。這到底是簡單筆誤,還是整個(gè)數(shù)據(jù)都弄錯(cuò)了呢?咱也不好說,反正第一張表里顯示的阿茲夫定組平均發(fā)燒天數(shù)更短也是作為有效性之一在論文里提出來的。但都是這樣的嚴(yán)謹(jǐn)程度,還值得相信嗎?
不過阿茲夫定牛就牛在,別人都要幾千人才能做出有效性,它堅(jiān)持幾百人解決問題;別人試驗(yàn)受試者招不滿,一般都是失敗告終,它能減員做出“有效性”;別人錯(cuò)過了主要終點(diǎn),都是灰頭土臉,它能理直氣壯說安全有效。難怪引得國內(nèi)多位權(quán)威專家競折腰,不信看新聞稿:
就好像有人明確地非常渣,卻偏偏有很多人還要圍著他轉(zhuǎn)。這里面可能有各種原因,比如人家有錢,有權(quán),有特長??蓡栴}是,不論別人為何折腰,你有必要也去被人家渣嗎,也去做韭菜被人割嗎?
新冠是一個(gè)自限性疾病,絕大多數(shù)人不需要任何藥物就能自愈。即便是高危人群,能起幫助的也是真實(shí)有效的藥物,而不是沒藥非硬拉一個(gè)出來吃。
記?。哼h(yuǎn)離渣藥保平安。
參考資料:
https://www.researchsquare.com/article/rs-2273694/v1
https://www.researchsquare.com/article/rs-2273657/v1
https://www1.hkexnews.hk/app/sehk/2022/104646/documents/sehk22080402059.pdf
https://www.nejm.org/doi/full/10.1056/NEJMoa2118542
https://www.nejm.org/doi/full/10.1056/NEJMoa2116044
https://clinicaltrials.gov/ct2/show/record/NCT05011513
https://www.briibio.com/news-detail.php?id=354
推薦閱讀