T-Statistic Là Gì

  -  

Đây là bài dịch giờ Việt của mình về một bài viết rất lôi cuốn giải thích ý nghĩa sâu sắc của pmùi hương pháp t-test (tốt cách thức kiểm tra t – vào nội dung bài viết tôi chỉ hotline là t-demo cho ngắn gọn) của tác giả Patriông xã Runkel. Bài nơi bắt đầu bởi giờ Anh có tên vừa đủ là “What Is a t-test? And Why Is It Like Telling a Kid to lớn Clean Up that Mess in the Kitchen?” và các chúng ta có thể đọc bài gốc trên trên đây.Quý khách hàng sẽ xem: S T Statistic Là Gì ? Thống Kê Kiểm Định Là Gì

Phương thơm pháp t-kiểm tra là 1 giữa những giấy tờ thủ tục được thực hiện thịnh hành nhất vào công nghệ thống kê lại.

Bạn đang xem: T-statistic là gì

Nhưng thậm chí là các người tiêu dùng t-test một bí quyết liên tiếp cũng băn khoăn đúng đắn phương pháp này hoạt động như thế nào vì chưng toàn bộ các dữ liệu phần đông được xử trí sau tấm màn bịt của những ứng dụng những thống kê, ví như Minitab.

Và thật là đáng nhằm họ bỏ một chút ít thời gian để thấy phương thức t-kiểm tra vận động như thế nào ở ẩn dưới tấm màn che đó.

Bởi bởi nếu như khách hàng gọi được giải pháp cách thức t-kiểm tra chuyển động, bạn có thể đọc ở 1 mức độ sâu hơn về tài liệu của chúng ta dựa vào công dụng cơ mà phương thức t-test mang đến. Và bạn cũng phát âm sâu rộng tại sao kết quả nghiên cứu và phân tích của chúng ta đã có được (hoặc không đạt được) “chân thành và ý nghĩa thống kê” (statistical significant).

Thực tế là nếu bạn có một người con vẫn trong tuổi teen mê thích ăn nghịch nhiều hơn nữa là mê say thao tác đơn vị thì chắc rằng là bạn đã có một đòi hỏi hệt như những nguyên lý cơ bản đằng sau phương thức t-demo.


*

Giải phẫu phương pháp t-test

Phương pháp t-thử nghiệm được sử dụng một cách phổ cập nhằm khẳng định coi liệu cực hiếm trung bình của một quần thể (the mean of a population) bao gồm khác hoàn toàn với cùng một quý giá như thế nào kia (Call là giá trị mức độ vừa phải đưa thuyết – a hypothesized mean) hoặc với mức giá trị vừa đủ của một quần thể không giống.

lấy ví dụ như, phương pháp 1-sample t-test (hay cách thức kiểm nghiệm t cho 1 mẫu) được dùng để làm chu chỉnh coi liệu thời hạn đợi vừa phải của những người bệnh vào một bệnh viện y học có lâu dài hơn so với thời hạn ước muốn là 15 phút hay không, dựa trên tài liệu từ một nhóm bỗng nhiên các người bệnh.

Để xác minh xem liệu sự khác hoàn toàn (giữa thời gian chờ thực tế và thời hạn hy vọng muốn) gồm ý nghĩa thống kê hay không, phương pháp t-kiểm tra sẽ tính toán thù một cực hiếm call là t-value (quý hiếm p-value khét tiếng cũng rất được rước trực tiếp từ t-value). Giá trị này được xem như sau:

t = fracarx - mu _0fracssqrtn

Công thức tân oán học này trông có vẻ như bí hiểm dẫu vậy thực chất chúng ta trọn vẹn rất có thể thống trị được nó nếu bạn phát âm được hai động lực quan trọng đặc biệt phía sau nó : thành phần số (nghỉ ngơi phía trên) cùng phần mẫu số (ngơi nghỉ phía dưới).

Phần tử số là Tín Hiệu

Phần tử số trong công thức 1-sample t-chạy thử giám sát độ mạnh mẽ của dấu hiệu (signal): sự biệt lập giữa giá trị mức độ vừa phải của chủng loại tài liệu của bạn (arx) và quý giá vừa phải đưa tngày tiết của quần thể (mu_0).


*

Trở lại với ví dụ về thời hạn đợi của những người mắc bệnh, quý giá vừa đủ trả tmáu là 15 phút ít.

Nếu các người mắc bệnh trong chủng loại dữ liệu bỗng nhiên của người sử dụng tất cả thời gian chờ mức độ vừa phải là 15.1 phút ít, biểu thị bằng 15.1 – 15 = 0.1 phút ít. Giá trị biệt lập này kha khá bé dại, vì thế biểu hiện sống bộ phận số thì yếu.

Phần mẫu mã số là Nhiễu

Phần chủng loại số đo lường và tính toán cường độ giao động tốt “nhiễu” (noise) vào mẫu dữ liệu của người sử dụng.

Xem thêm: B-Tree Là Gì - Giới Thiệu Về B


*

Kí hiệu 

*

là độ lệch chuẩn (standard deviation) – bộc lộ nấc dao động trong dữ liệu của doanh nghiệp. Nếu bạn tất cả một người bị bệnh đợi 50 phút ít, một người mắc bệnh không giống đợi 12 phút, một người khác nữa ngóng 0.5 phút, một fan không giống nữa chờ 175 phút ít,… thì có thể nói rằng rằng dữ liệu của người sử dụng có không ít giao động. Điều này có nghĩa rằng giả dụ quý giá s càng Khủng, mức độ nhiễu trong dữ liệu của doanh nghiệp càng bự. Mặc không giống, nếu như khách hàng có một bệnh nhân hóng 14 phút ít, một fan khác chờ 16 phút, một người bị bệnh không giống hóng 12 phút ít, thì nói theo cách khác rằng dữ liệu của doanh nghiệp bao gồm ít xê dịch. Điều này còn có nghĩa rằng nếu như giá trị s càng nhỏ thì tài liệu của các bạn sẽ không nhiều “nhiễu” hơn.

Còn kí hiệu sqrtn làm việc phía dưới s tất cả ý nghĩa sâu sắc là gì? Đó là cnạp năng lượng bậc nhì size mẫu dữ liệu của khách hàng (ví dụ nếu mẫu của công ty tất cả 30 fan thì n = 30). Nếu đều sản phẩm công nghệ đa số cân nhau thì tài liệu của bạn sẽ bị nhiễu nhiều hơn thế nếu form size mẫu mã tài liệu của người tiêu dùng bé dại và sẽ ít nhiễu hơn nếu như kích cỡ chủng loại dữ liệu của chúng ta Khủng.

Giá trị t-value là tỉ lệ của Tín Hiệu đối với Nhiễu

Công thức phía trên cho thấy t-value dễ dàng là so sánh độ mạnh của biểu hiện cùng với độ nhiễu vào mẫu mã tài liệu của công ty.

Nếu biểu đạt tương đối yếu so với tầm độ nhiễu thì t-value đã nhỏ tuổi rộng. Do kia cường độ khác hoàn toàn đã ít có khả năng tất cả chân thành và ý nghĩa thống kê.


*

Tại biểu vật bên đề nghị của hình phía trên, sự biệt lập giữa cực hiếm vừa phải của tài liệu arx với quý giá mức độ vừa phải trả tngày tiết mu_0 là 16 phút ít. Nhưng chính vì các dữ liệu vào mẫu mã bị trải rộng ra phải sự khác hoàn toàn này không có ý nghĩa những thống kê. Tại sao lại nhỏng vậy? Bởi vì chưng t – value — tỉ trọng giữa tín hiệu cùng nhiễu — thì kha khá nhỏ xíu vì chủng loại số phệ.

Tuy nhiên, ví như biểu lộ thì bạo dạn kha khá so với nhiễu, size (tốt đối) của t-value đang to hơn. Do kia, sự khác hoàn toàn thân arx cùng mu_0 đang có tương đối nhiều tài năng có ý nghĩa sâu sắc thống kê hơn.


Tại hình trên, sự khác hoàn toàn thân arx với mu_0 cũng là 16 phút. Kích thước tài liệu cũng cân nhau. Nhưng lần này, các điểm dữ liệu teo cụm lại ngay sát nhau hơn. Vì dữ liệu ít xê dịch hơn, yêu cầu sự biệt lập của 16 phút ít bây giờ lại sở hữu chân thành và ý nghĩa những thống kê.

Thông điệp về ý nghĩa thống kê

Phương thơm pháp t-demo là ra sao cùng với câu hỏi bảo rực rỡ teenager nhà bạn đi vệ sinh bếp?

Nếu nlỗi nhãi con teenager sẽ nghe nhạc, vẫn nghịch video game, nhắn tin nhắn đến bạn bè, hoặc bị chểnh mảng do các mối cung cấp “nhiễu” khác, bạn cần phải nói to ra nhiều thêm với bạo phổi rộng nhằm rất có thể đạt được nút “ý nghĩa”. Hoặc trường hợp bạn cũng có thể xóa sổ được những mối cung cấp nhiễu thì các bạn hoàn toàn không cần thiết phải ăn lớn nói bự với rực rỡ teenager nhà của bạn.

Một biện pháp tương tự như, nếu như công dụng t-thử nghiệm của công ty không đã có được ý nghĩa sâu sắc thống kê thì hoàn toàn có thể là do một trong các nguyên nhân sau đây:

Độ khác biệt (tín hiệu) là không đủ lớn. Quý Khách cần thiết làm cái gi được rộng ví như vấn đề này xảy ra, giả sử rằng nghiên cứu và phân tích của doanh nghiệp thực hiện đúng phương pháp và chủng loại dữ liệu nhưng mà chúng ta tích lũy mang tính chất đại diện đến quần thể.Độ xấp xỉ tài liệu (nhiễu) quá lớn. Đây là nguyên nhân vì sao Việc remove các điểm phi lý (outlier) trong tài liệu của người sử dụng là điều siêu đặc trưng. Quý Khách rất có thể cần sử dụng control chart để phân phát hiện nay cùng đào thải những điểm outlier ra khỏi dữ liệu trước khi tiến hành t-kiểm tra.

Xem thêm: Mực Hấp Sẵn Làm Món Gì Ngon, Cách Làm Mực Chiên Nước Mắm Đậm Đà Hấp Dẫn

Mẫu dữ liệu vượt nhỏ. Mức độ dao động đã nhỏ tuổi đi nếu như kích cỡ tài liệu to. Vấn đề này Tức là nếu như gồm cùng một độ biệt lập và và một quý giá giao động, giả dụ kích cỡ dữ liệu càng béo thì càng có tác dụng đã đạt được ý nghĩa sâu sắc thống kê – như biểu đồ vật dưới.


( Như vậy lý giải vì sao một mẫu dữ liệu gồm kích thước cực đại có thể tạo thành được chân thành và ý nghĩa thống kê lại tuy nhiên độ biệt lập cực kỳ bé dại cùng trọn vẹn không tồn tại tác động thực tế.)

Công thức này cũng phân tích và lý giải vì sao các công ty thống kê học tập lại thở than vào bội nghịch ứng cùng với ngữ điệu nhiều lúc được áp dụng để Tóm lại về một kết quả t-chạy thử. lấy ví dụ như, một tác dụng t-kiểm tra ko mong muốn chờ sẽ được tuyên bố : “There is no significant difference…”

Không độc nhất thiết phải nhỏng vậy…

Thực tế là hoàn toàn có thể bao gồm một độ biệt lập có ý nghĩa. Nhưng rất có thể chính vì mẫu mã dữ liệu của người sử dụng quá nhỏ tuổi, hoặc hoàn toàn có thể độ giao động của các điểm tài liệu quá to tạo nên nghiên cứu và phân tích của khách hàng ko diễn đạt được ý nghĩa những thống kê. Bạn hoàn toàn có thể phát biểu một phương pháp bình an rộng rằng: “Nghiên cứu của Cửa Hàng chúng tôi đang không kiếm thấy hội chứng cứ của một độ khác biệt với ý nghĩa những thống kê.”