在Stata 17中,我們介紹了用于創(chuàng)建和自定義表格的新collect命令集,以及用于創(chuàng)建和導(dǎo)出估計(jì)表的etable命令。Stata 18提供了另一個新命令dtable,它可以輕松地構(gòu)建和導(dǎo)出描述性統(tǒng)計(jì)數(shù)據(jù)表,在出版物中通常稱為Table 1?,F(xiàn)在,為分類變量和連續(xù)變量生成描述性統(tǒng)計(jì)表比以往任何時候都容易。值得一提的是,etable和dtable這兩個命令都是基于我們在Stata 17中引入的collect框架構(gòu)建的,因此它們共享許多屬性。
在本文中,將演示如何創(chuàng)建和導(dǎo)出描述性統(tǒng)計(jì)數(shù)據(jù)的簡單表格和較復(fù)雜的數(shù)據(jù)表,這些數(shù)據(jù)表按組顯示統(tǒng)計(jì)數(shù)據(jù),測試組間的差異等等。本文還將展示如何使用collect命令套件來進(jìn)一步自定義表的外觀,以及如何在完整的中包括使用dtable創(chuàng)建的表。
舉個簡單的實(shí)例
在Stata 18之前,如果我們想生成一個描述性數(shù)據(jù)統(tǒng)計(jì)表,可以使用summary來獲得連續(xù)變量的匯計(jì)數(shù)據(jù),并使用tabulate來報(bào)告分類變量的頻率、比例或百分比。我們以auto.dta(1978年的汽車數(shù)據(jù))為例:
這些命令為我們計(jì)算了統(tǒng)計(jì)數(shù)據(jù)。然而,手動將所有這些數(shù)字輸入到一個格式規(guī)范的表中是一項(xiàng)繁瑣的工作,而且當(dāng)我們有新數(shù)據(jù)時,它是**的。
相比之下,使用dtable,我們可以輸入
就像這樣簡單的,我們已經(jīng)建立了一個表,顯示了*連續(xù)變量(price, weight, 和 mpg)的數(shù)據(jù)樣本量、平均值和標(biāo)準(zhǔn)差,以及*分類變量水平的頻率和百分比(rep78)。
除了完整樣本的結(jié)果外,我們還可以通過添加by()選項(xiàng),分別請求組變量(比如foreign)的每個類別的上述統(tǒng)計(jì)信息:
我們可以使用by()中的子選項(xiàng)nototal來抑制總樣本的列。我們可以使用export()選項(xiàng)將該表導(dǎo)出到Word文檔myfile.docx中:
導(dǎo)出的表如下
請求自定義統(tǒng)計(jì)數(shù)據(jù)和檢驗(yàn)
默認(rèn)情況下,dtable報(bào)告數(shù)據(jù)集的樣本量、連續(xù)變量的均值和標(biāo)準(zhǔn)差,以及分類變量的頻率和百分比。但我們可以要求其他描述性統(tǒng)計(jì)數(shù)據(jù),如中位數(shù)和四分位數(shù)范圍。我們甚至可以為同一個表中的不同變量*不同的統(tǒng)計(jì)信息。在我們進(jìn)入較**的示例之前,您先看看下方dtable的對話框。
菜單Statistics > Summaries, tables, and tests > Table of descriptive statistics,打開dtable對話框。
瀏覽對話框中的選項(xiàng)卡以熟悉此命令。這是探索使用dtable可以做什么的好方法。我想**顯示三個選項(xiàng)卡,其余的留給您自己探索。
?在 Main選項(xiàng)卡上,我們可以*感興趣的連續(xù)變量和分類變量(使用i.因子變量表示法表示分類變量)。我們也可以*by變量。我們還可以查看其他結(jié)果,比如通過by組顯示檢驗(yàn)結(jié)果,是否要顯示樣本統(tǒng)計(jì)數(shù)據(jù)等。
?在Continuous選項(xiàng)卡上,我們可以*連續(xù)變量(它們可以在Main選項(xiàng)卡上*,也可以不*),并且我們可以請求針對不同變量的自定義統(tǒng)計(jì)數(shù)據(jù)和檢驗(yàn)。
?Factors選項(xiàng)卡的工作原理與Continuous選項(xiàng)卡類似。我們可以*factor變量,并為不同的變量選擇定制的統(tǒng)計(jì)和檢驗(yàn)。
例如,我們將加載Zeng, Mao, and Lin(2016)中提供的修改后的Modified Bangkok IDU Preparatory Study數(shù)據(jù)。我們可以嘗試為不同的變量*自定義的統(tǒng)計(jì)信息和檢驗(yàn),而不是生成默認(rèn)的表。在這里,我使用了對話框(主要是上面提到的三個選項(xiàng)卡)來輕松地構(gòu)建表,相應(yīng)的語法顯示在下面的輸出中。
在該表中,我們要求報(bào)告以下描述性統(tǒng)計(jì)數(shù)據(jù):1) age變量的平均值、較小值和較大值;2) 變量ltime和rtime的均值、偏度和峰度;3)needle變量的頻率和比例;4)變量jail 和inject的頻率。統(tǒng)計(jì)數(shù)據(jù)分別報(bào)告每個級別的組變量male。我們還顯示了每組的樣本量和比例。
您可能會注意到,我們添加了一列自定義檢驗(yàn)來比較組之間的變量。只有在*了by變量時,才能包含檢驗(yàn)。因?yàn)槲覀冊?/span>testnotes上*了by()子選項(xiàng),所以我們?yōu)椴煌兞窟x擇的特定檢驗(yàn)在注釋中(表前)有明確提及。
連續(xù)變量的可用檢驗(yàn)類型如下:
分類變量的可用的檢驗(yàn)類型如下:
有了這些選項(xiàng),dtable可以非常方便地執(zhí)行跨組比較變量的許多檢驗(yàn),并一步到位將p值放入表中。
自定義格式和樣式
從上表可以看出,我們可以對其外觀進(jìn)行改進(jìn)。例如,我們想在列標(biāo)題中而不是在**行中顯示子組樣本大小和比例。我們可能還想增加或減少某些統(tǒng)計(jì)數(shù)據(jù)報(bào)告的小數(shù)位數(shù)。我們可能希望將min值和max值的顯示格式更改為“min-max”,并將其放入括號中,我們也可能希望將比例放入括號中。所有這些更改都可以通過dtable選項(xiàng)完成,而*額外編碼。以下是修改后的dtable語法和輸出。
在上面的語法中,我使用選項(xiàng)define()來定義一個新的復(fù)合統(tǒng)計(jì)數(shù)據(jù)minmax,使用現(xiàn)有的統(tǒng)計(jì)數(shù)據(jù)min和max(分隔符“-”用于組合它們)。我們還使用選項(xiàng)nformat()和sfomat()分別更改一些統(tǒng)計(jì)數(shù)據(jù)的數(shù)字顯示格式和字符串顯示格式。請注意,“%s”是我們正在編輯字符串格式的統(tǒng)計(jì)數(shù)據(jù)的占位符。
如上面例子所示,如果喜歡現(xiàn)在的表,我們可以使用export()選項(xiàng)將表導(dǎo)出到文檔中。下面列出了所有支持的導(dǎo)出表的文件類型:
北京天演融智軟件有限公司(科學(xué)軟件網(wǎng))是STATA軟件在中國的授權(quán)經(jīng)銷商,為中國軟件用戶提供優(yōu)質(zhì)的軟件銷售和培訓(xùn)服務(wù)。
詞條
詞條說明
Stata/Python integration part 1: Setting up Stata
Python integration is one of the most exciting features in Stata 16. There are thousands of free Python packages that you can use to access and process data from the Internet, visualize data, explore
SPSSPRO 區(qū)分方差分析、T檢驗(yàn)、卡方檢驗(yàn)
差異研究的目的在于比較兩組數(shù)據(jù)或多組數(shù)據(jù)之間的差異,通常包括以下幾類分析方法:1、方差分析單因素方差分析用于檢驗(yàn)單因素水平下的一個或多個獨(dú)立因變量均值是否存在顯著差異,即檢驗(yàn)單因素各個水平的值是否來自同一個總體。由此可以看出,用于分析的數(shù)據(jù)包括一個因素(自變量)、一個或多個相互獨(dú)立的因變量。注意,因變量必須是連續(xù)型變量。多因素方差分析用于分析多個因素的不同水平是否對結(jié)果有顯著影響。如果存在主效應(yīng)顯
Visual Modflow Flex地下水流動和污染物運(yùn)移建模培訓(xùn)
Visual Modflow是目前**上較為流行且一致認(rèn)可的三維地下水流和溶質(zhì)運(yùn)移模擬的標(biāo)準(zhǔn)可視化專業(yè)軟件。本次為大家安排了四天的線上課程,課程中含有大量的軟件實(shí)操練習(xí),讓您較好的理解概念并應(yīng)用。如果您在實(shí)際應(yīng)用中,有任何問題,也可以給您解答。如果您感興趣可以登陸:?科學(xué)軟件網(wǎng)——收費(fèi)培訓(xùn)? 查看具體詳情。?講師介紹該課程將由Waterloo Hydrogeologi
2023年9-11月Stata軟件系列免費(fèi)在線研討會
Stata是一個完整的、集成的軟件包,它提供了所有數(shù)據(jù)科學(xué)所需的數(shù)據(jù)操作、可視化、統(tǒng)計(jì)和自動化報(bào)告功能。為了讓大家較好的掌握Stata軟件,StataCorp LLC為大家安排了一系列免費(fèi)的在線培訓(xùn)。主題:Ready. Set. Go Stata時間:19 September 2023, 9:00 AM CT?? ? ? ? ? &nbs
公司名: 北京天演融智軟件有限公司
聯(lián)系人: 張經(jīng)理
電 話:
手 機(jī): 18610814366
微 信: 18610814366
地 址: 北京海淀海淀上地東路35號院1號樓3層1-312318、1-312-319
郵 編:
網(wǎng) 址: turntech88.b2b168.com
公司名: 北京天演融智軟件有限公司
聯(lián)系人: 張經(jīng)理
手 機(jī): 18610814366
電 話:
地 址: 北京海淀海淀上地東路35號院1號樓3層1-312318、1-312-319
郵 編:
網(wǎng) 址: turntech88.b2b168.com
智能云閱卷機(jī) 高速閱讀機(jī) 讀卡機(jī)怎么識別答題卡
¥13800.00