Phương pháp thống kê được xây dựng để làm gì

Việc làm Thống kê

Thống kê là gì?

Thống kê theo một nghĩa hiểu trừu tượng đó là ngành nghiên cứu lý thuyết và gồm các phương pháp thu thập, tổng hợp và phân tích số liệu cùng các hiện tượng cần quan sát. Đây là khái niệm thống kê được phân tích từ chuyên ngành kinh tế học. Thống kê được sử dụng trong ngành này kết hợp với nhiều số liệu để nghiên cứu hiện tượng kinh tế và kiểm định các lý thuyết kinh tế. 

Còn khi là tên của một vị trí công việc, thống kê là xác định mức độ biến động, biểu hiện tính chất và trình độ chặt chẽ của mối liên hệ hiện tượng. Hay hiểu một cách đơn giản, trong sản xuất thống kê chính là việc ghi lại một cách tổng quan về tình hình sản xuất kinh doanh của doanh nghiệp trong khoảng thời gian yêu cầu, kết quả thống kê được thể hiện qua số lượng. 

Nghiệp vụ thống kê rất cần thực hiện trong các nhà máy sản xuất, thay nhà lãnh đạo ghi nhận hiệu suất hoạt động mỗi ngày, mỗi tháng, mỗi năm để đánh giá một cách đầy đủ và toàn diện hoạt động kinh doanh của doanh nghiệp, công ty, tổ chức phi lợi nhuận hay một tổ chức kinh doanh bất kỳ. Thống kê không chỉ có tác dụng trong lĩnh vực sản xuất mà nó còn xuất hiện ở hầu hết doanh nghiệp len lỏi trong các nghiệp vụ kế toán. Nhân viên kế toán cũng như một nhân viên thống kê, thực hiện công việc của nhân viên thống kê để tập hợp dữ liệu từ các phòng ban từ đó tiến hành phân tích, lập báo cáo tài chính, báo cáo kinh doanh. Nhân viên thống kê cũng chính là nguồn cung cấp dữ liệu thông tin cho nhân viên kế toán, hỗ trợ - supporting họ rất nhiều công việc. 

Click ngay để: Tham khảo mức lương nhân viên thống kê hiện nay

Việc làm Dệt may - Da giày

Công việc thống kê làm gì trong sản xuất?

Xuất hiện và thể hiện vai trò quan trọng nhất trong doanh nghiệp sản xuất, vị trí nhân viên thống kê mở ra cơ hội cho người lao động trong các nhà máy, xí nghiệp cũng có thể làm việc trên văn phòng nhưng sau khi quá trình sản xuất kết thúc họ phải xuống nhà máy để xem xét tình hình , thống kê kết quả bằng những con số. 

Nhân viên thống kê, làm việc trong phòng kế hoạch của công ty, ngoài việc tổng hợp con số sau quá trình sản xuất, họ còn dự báo bán hàng, đơn hàng, năng lực sản xuất của nhà máy để lên kế hoạch sản xuất phù hợp cho Công ty. Bên cạnh đó, từ số liệu thu thập được trong nội bộ, nhân viên thống kê phải phối hợp với phòng Marketing để lấy số liệu thống kê từ thị trường về nhu cầu khách hàng, lượng sản phẩm tiêu thụ để lên kế hoạch, dự báo số lượng sản xuất phù hợp đảm bảo tiết kiệm kinh phí, đạt lợi nhuận cao nhất cho doanh nghiệp. 

Thống kê được tiến hành sau quá trình sản xuất với công việc cụ thể như:

- Thống kê mỗi ngày số liệu NVL đầu vào phục vụ cho quá trình sản xuất bao gồm: nguyên phụ liệu, thứ phẩm tái chế, thành phẩm chưa phải sản phẩm hoàn hảo phục vụ cho công đoạn sản xuất tiếp theo,…

- Thực hiện báo cáo tổng kết các số liệu thống kê, những sự cố bất thường phát sinh trong quá trình sản xuất trong nhà máy và cách giải quyết cho ban lãnh đạo, cụ thể là production manager, đồng thời theo dõi đôn đốc công nhân làm việc đảm bảo kịp tiến độ giao hàng, gia tăng uy tín của doanh nghiệp 

- Lập báo cáo thống kê định kỳ theo quy định chế độ báo cáo thống kê theo GSO - Tổng cục thống kê Nhà nước và Công ty 

- Thu thập số liệu rồi tổng hợp cung cấp cho nhà lãnh đạo, cho nhân viên kế toán để họ thực hiện các nghiệp vụ khác. Tiếp đó là tiến hành lưu trữ số liệu thống kê tổng hợp đồng thời đề xuất cho Công ty ý kiến đóng góp để cải tiến tình hình sản xuất khi cần thiết phục vụ cho sự phát triển dài lâu của doanh nghiệp.

- Phối hợp với các bộ phận khác có chức năng liên quan để tổng hợp số liệu, thực hiện thống kê theo quy định. 

- Phân tích thống kê những kết quả hoạt động sản xuất kinh doanh theo thời gian yêu cầu thường là theo tháng, quý, năm,… tùy theo yêu cầu đặt ra của nhà lãnh đạo  

Công việc của nhân viên thống kê không hề ít nhưng không khó thực hiện vì vậy so với các ngành nghề đòi hỏi chuyên môn, kỹ năng, năng lực nghề nghiệp cao khác, mức lương dành cho lao động làm tại vị trí này không thể hơn nhưng so với công việc ít chuyên môn có tính chất công việc tương đương khách thì mức lương trung bình khoảng 7 triệu ở vị trí này lại khá hấp dẫn. 

>> Xem thêm: Inspection là gì

3. Công việc của nhân viên thống kê trong lĩnh vực kinh doanh cụ thể 

Trên đây là công việc cho một nhân viên thống kê nói chung còn với từng ngành sản xuất cụ thể chẳng hạn: 

Ngành may mặc hiện nay 

Ngành may mặc là một trong những khối ngành điển hình cho hoạt động kinh doanh sản xuất trong các nhà máy hiện nay. May mặc cũng đang có thị trường phát triển kinh doanh khá nở rộ khi nó trở thành nhu cầu thiết yêu không thể thiếu của con người. Khi nào nhu cầu sống của con người còn tiếp tục tăng thì khi đó lĩnh vực may mặc vẫn có “đất dụng võ”. 

Trong nhà máy của các công ty may, vị trí nhân viên thống kê có trách nhiệm đảm nhận những công việc sau:

- Làm báo cáo sản xuất hàng ngày, trả lời email các công việc liên quan gửi cho Ban lãnh đạo và các bộ phận 

- Cập nhật số liệu vào phần mềm 

- Nhận kế hoạch sản xuất, theo dõi cập nhật và giao cho các chuyền may, bộ phận may 

- Theo dõi ngày bắt đầu và kết thúc của đơn hàng

- Làm đề nghị mua, lãnh và cấp phát các loại vật tư phục vụ sản xuất

- Tính lương sản phẩm của công nhân

- Những công việc khác theo yêu cầu của ban lãnh đạo  

Yêu cầu trúng tuyển vào vị trí này trong công ty may không khó, chỉ cần bạn là người nhanh nhẹn, biết tin học văn phòng, sức khỏe tốt, trung thực. Lợi thế trúng tuyển sẽ cao hơn nếu bạn đã có kinh nghiệm làm thống kê ở Công ty may mặc, có chuyên môn ngành kế toán, công nghệ may hoặc ngành nghề liên quan tới may mặc.

Việc làm nhân viên thống kê

>> Xem thêm: Ngành công nghiệp trọng điểm là gì

3.2. Nhân viên thống kê thủy sản làm gì? 

Lợi thế nhân viên thống kê trong lĩnh vực thủy sản khi nước ta có đường bờ biển dài, sản lượng khai thác thủy sản hàng năm đạt số lượng lớn. Công ty thủy sản chủ yếu nằm ở khu vực gần biển, hoạt động chế biến thủy sản vừa tiêu thụ trong nước vừa xuất khẩu sang nước ngoài tạo ra cơ hội việc làm hấp dẫn giải quyết đáng kể tình trạng thất nghiệp trong xã hội hiện nay. Trong đó vị trí nhân viên thống kê cũng đang mở ra nhiều cơ hội cho lao động. Công việc không mấy khó khăn chỉ cần bạn đáp ứng được những yêu cầu cơ bản về sức khỏe, làm việc trong thời gian dài, nhanh nhẹn, trung thực, và một số yêu cầu khác tùy theo tiêu chí tuyển dụng của mỗi doanh nghiệp để thực hiện những công việc sau:

- Thống kê xuất nhập hàng hóa trong kho 

- Tổng hợp, theo dõi đối chiếu số lượng xuất nhập hàng hóa hàng ngày và theo định kỳ rồi báo cáo công việc cho quản lý hay trưởng bộ phận

- Ghi nhận số liệu thống kê bán thành phần 

- Thực hiện những công việc khác theo yêu cầu của quan lý, trưởng bộ phận 

Nếu bạn đang có định hướng tại vị trí nhân viên thống kê và đang có thắc mắc nhân viên thống kê làm gì thì đây chắc chắn là bài viết dành cho bạn lúc này. Và nếu muốn xin việc nhân viên thống kê hãy tạo cho mình một cv nhân viên thống kê đẹp nhất ngay tại timviec365.vn nhé. Hy vọng thông tin Timviec365.vn chia sẻ trong bài viết trên đây là hữu ích với nhiều độc giả. Hãy thường xuyên truy cập website Timviec365.vn để cập nhật thông tin bổ ích mỗi ngày nhé!

“Một số người nghĩ rằng họ luôn đúng. Những người như vậy không thể là nhà khoa học giỏi cũng như không quan tâm đến thống kê… Vụ án được đưa từ trên trời xuống đất, nơi nó trở thành một phần của thế giới khoa học ”. [Dimend S.]

“Cơ hội chỉ là thước đo cho sự thiếu hiểu biết của chúng ta. Các hiện tượng ngẫu nhiên, nếu chúng ta định nghĩa chúng, sẽ là những hiện tượng có quy luật mà chúng ta không biết. [A. Poincare "Khoa học và Giả thuyết"]

“Vinh dự được dịp này. Nó không phải là một trường hợp
Luôn ngang hàng với cái bất biến ...
Cơ hội thường điều khiển sự kiện,
Tạo ra cả niềm vui và nỗi đau.
Và cuộc sống đặt ra trước mắt chúng ta một nhiệm vụ:
Làm thế nào để hiểu được vai trò của cơ hội "
[từ cuốn sách của B.A. Kordemsky “Toán học nghiên cứu tính ngẫu nhiên”]

Thế giới tự nó là logic - đây là cách chúng ta thường suy nghĩ và nghiên cứu các quy luật vật lý, hóa học, v.v. hiện tượng hoặc kinh nghiệm khi nó được lặp lại. “Hiệu ứng ngẫu nhiên” được tạo ra với tính đều đặn vốn có của “tiền định tiềm ẩn”, tức là cơ hội cần có một kết quả thường xuyên.

Các nhà toán học chỉ coi các sự kiện ngẫu nhiên trong tình thế tiến thoái lưỡng nan "có thể xảy ra hoặc không xảy ra" - đến hoặc không xảy ra.

Sự định nghĩa. Ngành toán học ứng dụng nghiên cứu các đặc tính định lượng của các sự kiện hoặc hiện tượng ngẫu nhiên hàng loạt được gọi là thống kê toán học.

Sự định nghĩa. Sự kết hợp giữa các yếu tố của lý thuyết xác suất và thống kê toán học được gọi là ngẫu nhiên.

Sự định nghĩa. Stochastic- đây là nhánh toán học hình thành và phát triển gắn liền với hoạt động thực tiễn của con người. Ngày nay, các yếu tố của ngẫu nhiên được đưa vào toán học cho tất cả mọi người, trở thành một khía cạnh mới, quan trọng của toán học và giáo dục phổ thông.

Sự định nghĩa. Thống kê toán học- khoa học về các phương pháp toán học về hệ thống hóa, xử lý và sử dụng dữ liệu thống kê cho các kết luận khoa học và thực tiễn.

Hãy nói về điều này chi tiết hơn.

Quan điểm về thống kê toán học như một môn khoa học về các phương pháp tổng quát để xử lý kết quả của một thí nghiệm hiện nay thường được chấp nhận. Để giải quyết những vấn đề này, một thí nghiệm cần có những gì để các phán đoán được đưa ra trên cơ sở của nó là đúng. Thống kê toán học một phần đang trở thành khoa học của thiết kế thí nghiệm.

Theo các nhà khoa học hiện đại nổi tiếng Hodges và Lehman, nghĩa của từ “thống kê” trong hai thế kỷ qua đã có những thay đổi đáng kể, - từ “thống kê” có cùng gốc với từ “trạng thái” [state] và ban đầu có nghĩa là Nghệ thuật và khoa học quản lý: những giáo viên đầu tiên của ngành thống kê đại học Đức vào thế kỷ 18 ngày nay được gọi là các nhà khoa học xã hội. Bởi vì các quyết định của chính phủ ở một mức độ nào đó dựa trên dữ liệu về dân số, ngành, v.v. các nhà thống kê, tất nhiên, trở nên quan tâm đến những dữ liệu đó, và dần dần từ "thống kê" bắt đầu có nghĩa là thu thập dữ liệu về dân số, về trạng thái, và sau đó nói chung là thu thập và xử lý dữ liệu. Sẽ chẳng ích gì khi trích xuất dữ liệu nếu không có lợi ích gì từ nó và các nhà thống kê đương nhiên tham gia vào việc giải thích dữ liệu.

Các nhà thống kê hiện đại nghiên cứu các phương pháp mà qua đó có thể đưa ra các suy luận về một dân số từ dữ liệu thường thu được từ một mẫu "dân số".

Sự định nghĩa. Nhà thống kê- một người nghiên cứu khoa học về các phương pháp toán học hệ thống hóa, xử lý và sử dụng dữ liệu thống kê để đưa ra các kết luận khoa học và thực tiễn.

Thống kê toán học bắt nguồn từ thế kỷ 17 và phát triển song song với lý thuyết xác suất. Sự phát triển hơn nữa của thống kê toán học [nửa sau thế kỷ 19 và đầu thế kỷ 20] chủ yếu là do P.L. Chebyshev, A.A. Markov, A.M. Lyapunov, K. Gauss, A. Quetelet, F. Galton, K Pearson, và những người khác. Vào thế kỷ 20, đóng góp quan trọng nhất cho thống kê toán học là do A.N. Kolmogorov, V.I. Romanovsky, E.E. Slutsky, N.V. Smirnov, B.V. Gnedenko, cũng như Sinh viên Anh, R. Fisher, E. Purson và các nhà khoa học Mỹ [Yu. Neumann, A Wald].

Các vấn đề về thống kê toán học và ý nghĩa của sai số trong thế giới khoa học

Việc thiết lập các mẫu mà hiện tượng ngẫu nhiên hàng loạt là đối tượng dựa trên việc nghiên cứu dữ liệu thống kê của các kết quả quan sát bằng các phương pháp lý thuyết xác suất.

Nhiệm vụ đầu tiên của thống kê toán học là chỉ ra các phương pháp thu thập và phân nhóm thông tin thống kê thu được do kết quả của các quan sát hoặc kết quả của các thí nghiệm được thiết kế đặc biệt.

Nhiệm vụ thứ hai của thống kê toán học là xây dựng các phương pháp phân tích dữ liệu thống kê tùy theo mục tiêu nghiên cứu.

Thống kê toán học hiện đại đang phát triển các cách để xác định số lượng bài kiểm tra cần thiết trước khi bắt đầu nghiên cứu [lập kế hoạch thí nghiệm], trong quá trình nghiên cứu [phân tích tuần tự]. Nó có thể được định nghĩa là khoa học về việc ra quyết định trong điều kiện không chắc chắn.

Một cách ngắn gọn, chúng ta có thể nói rằng nhiệm vụ của thống kê toán học là tạo ra các phương pháp thu thập và xử lý dữ liệu thống kê.

Khi nghiên cứu một hiện tượng ngẫu nhiên hàng loạt, người ta giả định rằng tất cả các phép thử đều được thực hiện trong các điều kiện giống nhau, tức là nhóm các yếu tố chính có thể được tính đến [đo lường] và có tác động đáng kể đến kết quả thử nghiệm, vẫn giữ nguyên các giá trị đó ở mức có thể.

Các yếu tố ngẫu nhiên làm sai lệch kết quả mà lẽ ra sẽ có được nếu chỉ có các yếu tố chính, làm cho nó trở nên ngẫu nhiên. Độ lệch của kết quả của mỗi phép thử so với kết quả thực được gọi là sai số của quan sát, là một biến ngẫu nhiên. Cần phân biệt giữa sai số hệ thống và sai số ngẫu nhiên.

Một thí nghiệm khoa học là không thể tưởng tượng nếu không có sai sót, giống như đại dương không có muối. Bất kỳ luồng dữ kiện nào bổ sung vào kiến ​​thức của chúng tôi đều mang lại một số loại sai sót. Theo một câu nói nổi tiếng trong cuộc sống của hầu hết mọi người, không có gì có thể chắc chắn, ngoại trừ cái chết và thuế, và nhà khoa học cho biết thêm: "Và những sai sót của kinh nghiệm."

Một nhà thống kê là một "con chó săn" chuyên săn tìm một con bọ. Công cụ thống kê để phát hiện lỗi.

Từ "sai lầm" không chỉ đơn giản có nghĩa là "tính toán sai". Hậu quả của việc tính toán sai lầm là một nguồn sai số thực nghiệm nhỏ và tương đối khó quan tâm.

Thật vậy, các công cụ của chúng tôi bị hỏng; mắt và tai của chúng ta có thể đánh lừa chúng ta; các phép đo của chúng ta không bao giờ hoàn toàn chính xác, thậm chí đôi khi các phép tính số học của chúng ta cũng sai. Một sai sót trong thí nghiệm là một cái gì đó cần thiết hơn một thước dây không chính xác hoặc một ảo ảnh quang học. Và vì công việc quan trọng nhất của thống kê là giúp các nhà khoa học phân tích sai số thực nghiệm, chúng ta phải cố gắng hiểu sai thực sự là gì.

Bất cứ vấn đề gì mà một nhà khoa học đang giải quyết, nó chắc chắn sẽ phức tạp hơn những gì anh ta muốn. Giả sử nó đo bụi phóng xạ ở các vĩ độ khác nhau. Kết quả sẽ phụ thuộc vào độ cao của những nơi lấy mẫu, vào lượng mưa cục bộ và vào các xoáy thuận độ cao trên một khu vực rộng lớn hơn.

Sai số thực nghiệm là một phần không thể thiếu của bất kỳ trải nghiệm khoa học thực sự nào.

Kết quả giống nhau có thể là lỗi và thông tin tùy thuộc vào vấn đề và quan điểm. Nếu một nhà sinh vật học muốn điều tra xem sự thay đổi trong chế độ ăn ảnh hưởng đến sự tăng trưởng như thế nào, thì sự hiện diện của một cấu tạo liên quan là một nguồn sai sót; nếu anh ta nghiên cứu mối quan hệ giữa di truyền và tăng trưởng, nguồn gốc của sai sót sẽ là sự khác biệt về dinh dưỡng. Nếu một nhà vật lý muốn điều tra mối quan hệ giữa độ dẫn điện và nhiệt độ, thì sự khác biệt về mật độ của vật liệu dẫn điện là một nguồn sai số; nếu anh ta nghiên cứu mối quan hệ giữa mật độ này và độ dẫn điện, sự thay đổi nhiệt độ sẽ là một nguồn sai số.

Việc sử dụng từ lỗi này có vẻ khó hiểu, và có lẽ tốt hơn nên nói rằng các hiệu ứng kết quả bị bóp méo bởi các ảnh hưởng "không mong muốn" hoặc "không mong muốn". Chúng tôi lập kế hoạch thử nghiệm để nghiên cứu các ảnh hưởng đã biết, nhưng các yếu tố ngẫu nhiên mà chúng tôi không thể thấy trước hoặc phân tích làm sai lệch kết quả bằng cách thêm các ảnh hưởng của chính chúng vào chúng.

Sự khác biệt giữa tác động có kế hoạch và tác động do nguyên nhân ngẫu nhiên cũng giống như sự khác biệt giữa chuyển động của một con tàu trên biển, đi dọc theo một lộ trình nhất định và một con tàu trôi dạt không mục đích theo lệnh thay đổi của gió và dòng chảy. Chuyển động của con tàu thứ hai có thể gọi là chuyển động ngẫu nhiên. Có thể con tàu này có thể đến bất kỳ cảng nào, nhưng nhiều khả năng nó sẽ không đến một địa điểm cụ thể nào.

Các nhà thống kê sử dụng từ "ngẫu nhiên" để chỉ một hiện tượng mà kết quả của nó tại một thời điểm sắp tới là hoàn toàn không thể dự đoán được.

Sai số do các tác động dự kiến ​​trong thí nghiệm đôi khi mang tính hệ thống hơn là ngẫu nhiên.

Lỗi hệ thống dễ gây hiểu lầm hơn lỗi ngẫu nhiên. Sự can thiệp từ một đài phát thanh khác có thể tạo ra một hệ thống đệm âm nhạc mà đôi khi bạn có thể đoán được nếu bạn biết giai điệu. Nhưng "phần đệm" này có thể khiến chúng ta nhận định sai về lời hoặc nhạc của chương trình mà chúng ta đang muốn nghe.

Tuy nhiên, việc phát hiện ra một lỗi có hệ thống thường dẫn chúng ta đến con đường của một khám phá mới. Biết được các lỗi ngẫu nhiên xảy ra như thế nào giúp chúng ta phát hiện ra các lỗi có hệ thống và do đó loại bỏ chúng.

Đặc điểm lý luận tương tự cũng phổ biến trong các vấn đề thế gian của chúng ta. Chúng ta thường nhận thấy: “Đây không phải là một tai nạn!”. Bất cứ khi nào chúng ta có thể nói điều đó, chúng ta đang trên con đường khám phá.

Ví dụ, A.L. Chizhevsky, phân tích các quá trình lịch sử: sự gia tăng tỷ lệ tử vong, dịch bệnh, chiến tranh bùng nổ, cuộc di cư lớn của các dân tộc, thay đổi khí hậu đột ngột, v.v. đã phát hiện ra mối quan hệ giữa các quá trình không liên quan này và các thời kỳ hoạt động của mặt trời, chúng có các chu kỳ: 11 năm, 33 năm.

Sự định nghĩa. dưới lỗi hệ thốngđược hiểu là lỗi lặp đi lặp lại và giống nhau đối với tất cả các lần kiểm tra. Nó thường được kết hợp với việc tiến hành sai thí nghiệm.

Sự định nghĩa. Dưới những sai lầm ngẫu nhiênđề cập đến lỗi phát sinh dưới tác động của các yếu tố ngẫu nhiên và thay đổi ngẫu nhiên từ kinh nghiệm này sang kinh nghiệm khác.

Thông thường, sự phân bố của sai số ngẫu nhiên là đối xứng về 0, điều này dẫn đến một kết luận quan trọng: trong trường hợp không có sai số hệ thống, kết quả thử nghiệm thực sự là kỳ vọng toán học của một biến ngẫu nhiên, giá trị cụ thể của nó được cố định trong mỗi phép thử.

Đối tượng nghiên cứu của thống kê toán học có thể là các đặc trưng định tính hoặc định lượng của hiện tượng hoặc quá trình được nghiên cứu.

Trong trường hợp là một tính trạng định tính, số lần xuất hiện của tính trạng này trong chuỗi thí nghiệm đã xét được tính; con số này là biến ngẫu nhiên [rời rạc] đang được nghiên cứu. Ví dụ về các thuộc tính chất lượng là khuyết tật trên một bộ phận đã hoàn thiện, nhân khẩu học, v.v. Nếu dấu hiệu là định lượng, thì trong thí nghiệm, phép đo trực tiếp hoặc gián tiếp được thực hiện bằng cách so sánh với một tiêu chuẩn nhất định - một đơn vị đo lường - sử dụng các dụng cụ đo lường khác nhau. Ví dụ, nếu có một lô các bộ phận, thì tiêu chuẩn của bộ phận đó có thể dùng như một dấu hiệu định tính và kích thước được kiểm soát của bộ phận có thể dùng như một dấu hiệu định lượng.

Định nghĩa cơ bản

Một phần đáng kể của thống kê toán học gắn liền với nhu cầu mô tả một tập hợp lớn các đối tượng.

Sự định nghĩa. Toàn bộ tập hợp các đối tượng được nghiên cứu được gọi là dân số chung.

Dân số chung có thể là toàn bộ dân số của đất nước, sản lượng hàng tháng của nhà máy, số lượng cá sống trong một hồ chứa nhất định, v.v.

Nhưng dân số chung không chỉ là một tập hợp. Nếu nhóm đối tượng quan tâm của chúng ta quá nhiều, hoặc đối tượng khó tiếp cận, hoặc có lý do nào khác không cho phép nghiên cứu tất cả các đối tượng, chúng ta sẽ dùng đến việc nghiên cứu một số phần của đối tượng.

Sự định nghĩa. Phần đó của các đối tượng phải kiểm tra, nghiên cứu, v.v., được gọi là dân số mẫu hoặc đơn giản mẫu vật.

Sự định nghĩa. Số phần tử trong tổng thể và mẫu chung được gọi là khối lượng.

Làm thế nào để đảm bảo rằng mẫu đại diện tốt nhất cho toàn bộ, tức là sẽ là đại diện?

Nếu là một số nguyên, tức là nếu chúng ta ít hoặc hoàn toàn không biết đến dân số chung, thì không có gì tốt hơn là một sự lựa chọn hoàn toàn ngẫu nhiên. Nhận thức nhiều hơn cho phép bạn hành động tốt hơn, nhưng vẫn ở một số giai đoạn, sự thiếu hiểu biết dẫn đến và kết quả là sự lựa chọn ngẫu nhiên.

Nhưng làm thế nào để thực hiện một lựa chọn hoàn toàn ngẫu nhiên? Theo quy định, việc lựa chọn dựa trên các đặc điểm dễ quan sát, đối với nghiên cứu mà nghiên cứu đang được tiến hành.

Việc vi phạm các nguyên tắc lựa chọn ngẫu nhiên đã dẫn đến những sai sót nghiêm trọng. Một cuộc thăm dò do tạp chí Mỹ Literaturnoye Obozrenie thực hiện về kết quả của cuộc bầu cử tổng thống năm 1936 đã trở nên nổi tiếng vì thất bại của nó. Các ứng cử viên trong cuộc bầu cử này là F.D. Roosevelt và A.M. Landon.

Ai đã chiến thắng?

Là một dân số chung, các biên tập viên đã sử dụng danh bạ điện thoại. Sau khi chọn ngẫu nhiên 4 triệu địa chỉ, cô đã gửi đi những tấm bưu thiếp với những câu hỏi về thái độ đối với các ứng cử viên tổng thống trong cả nước. Sau khi chi một khoản lớn cho việc gửi thư và xử lý bưu thiếp, tạp chí thông báo rằng Landon sẽ giành chiến thắng trong cuộc bầu cử tổng thống sắp tới. Kết quả bầu cử hóa ra ngược lại với dự báo này.

Có hai sai lầm được thực hiện ở đây. Thứ nhất, danh bạ điện thoại không cung cấp một mẫu đại diện về dân số Hoa Kỳ - hầu hết là những người đứng đầu gia đình giàu có. Thứ hai, không phải tất cả mọi người đều gửi câu trả lời, mà một phần đáng kể là đại diện của giới kinh doanh, những người đã ủng hộ Landon.

Đồng thời, các nhà xã hội học J. Gallan và E. Warner đã dự đoán đúng về chiến thắng của F.D. Roosevelt, chỉ dựa trên bốn nghìn bảng câu hỏi. Lý do cho sự thành công này không chỉ là việc lựa chọn chính xác mẫu. Họ đã tính đến rằng xã hội đang chia thành các nhóm xã hội đồng nhất hơn trong mối quan hệ với các ứng cử viên tổng thống. Do đó, mẫu từ lớp có thể tương đối nhỏ với cùng độ chính xác. Cuối cùng, Roosevelt đã giành chiến thắng, ông là người ủng hộ các cải cách cho các bộ phận dân cư ít giàu có hơn.

Có kết quả điều tra theo từng lớp, có thể xác định được đặc điểm của toàn xã hội.

Các mẫu là gì?

Đây là những hàng số.

Hãy để chúng tôi trình bày chi tiết hơn về các khái niệm cơ bản đặc trưng cho loạt mẫu.

Một mẫu cỡ n được lấy từ dân số chung > n 1, trong đó n 1 là số lần quan sát thấy sự xuất hiện của x 1, n 2 - x 2, v.v.

Các giá trị quan sát của x i được gọi là các lựa chọn, và chuỗi các lựa chọn được viết theo thứ tự tăng dần được gọi là một chuỗi biến thể. Số lần quan sát n i được gọi là tần số và n i / n - tần số [hoặc tần số] tương đối.

Sự định nghĩa. Các giá trị khác nhau của một biến ngẫu nhiên được gọi là tùy chọn.

Sự định nghĩa. loạt biến thểđược gọi là một loạt các lựa chọn được sắp xếp theo thứ tự tăng dần [hoặc giảm dần] với các tần số [tần số] tương ứng của chúng.

Khi nghiên cứu chuỗi biến phân, cùng với các khái niệm về tần số, khái niệm tần số tích lũy được sử dụng. Các tần số [tần số] tích lũy cho mỗi khoảng được tìm thấy bằng cách tổng liên tiếp các tần số của tất cả các khoảng trước đó.

Sự định nghĩa. Sự tích tụ của tần số hoặc tần số được gọi là tích lũy. Bạn có thể tích lũy các tùy chọn tần số và khoảng thời gian.

Đặc điểm của một loạt có thể là định lượng và định tính.

Các đặc điểm định lượng [biến đổi] là những đặc điểm có thể biểu thị bằng số. Chúng được chia thành rời rạc và liên tục.

Đặc điểm [thuộc tính] định tính là những đặc điểm không biểu hiện bằng số.

Các biến liên tục là các biến được biểu diễn dưới dạng số thực.

Các biến rời rạc là các biến chỉ được biểu thị dưới dạng số nguyên.

Các mẫu được đặc trưng xu hướng trung tâm: trung bình, chế độ và trung vị. Giá trị trung bình của mẫu là trung bình cộng của tất cả các giá trị của nó. Chế độ mẫu là các giá trị xảy ra thường xuyên nhất. Trung vị mẫu là số "chia" một nửa tập hợp có thứ tự của tất cả các giá trị trong mẫu.

Chuỗi biến thể có thể rời rạc hoặc liên tục.

Nhiệm vụ

Cho mẫu: 1,3; 1,8; 1,2; 3,0; 2.1; Số 5; 2,4; 1,2; 3,2; 1,2; 4; 2.4.

Đó là một loạt các tùy chọn. Sắp xếp các tùy chọn này theo thứ tự tăng dần, chúng ta nhận được một chuỗi biến thể: 1.2; 1,2; 1,2; 1,3; 1,8; 2.1; 2,4; 2,4; 3,0; 3.2; 4; 5.

Giá trị trung bình của chuỗi này là 2,4.

Trung vị của chuỗi là 2,25.

Chế độ của chuỗi là -1,2.

Hãy xác định các khái niệm này.

Sự định nghĩa. Giá trị trung bình của chuỗi biến thể giá trị đó của một biến ngẫu nhiên được gọi là giá trị này nằm ở giữa chuỗi biến phân [Me].

Trung vị của dãy số có thứ tự với một số thành viên lẻ là số được viết ở giữa và trung vị của dãy số có thứ tự với một số thành viên là số chẵn là trung bình cộng của hai số được viết ở giữa. Trung vị của một chuỗi số tùy ý là trung vị của chuỗi có thứ tự tương ứng.

Sự định nghĩa. Loạt Vogueđặt tên cho biến thể [giá trị của một biến ngẫu nhiên], tương ứng với tần số cao nhất [Mo], tức là cái này phổ biến hơn những cái khác.

Sự định nghĩa. Trung bình cộng của chuỗi biến thiên kết quả của phép chia tổng các giá trị của một biến thống kê cho số các giá trị này, tức là cho số hạng, được gọi.

Quy tắc tìm giá trị trung bình cộng của mẫu:

  1. nhân mỗi tùy chọn với tần số của nó [tính đa dạng];
  2. cộng tất cả các tác phẩm kết quả;
  3. chia tổng tìm được cho tổng của tất cả các tần số.

Sự định nghĩa. Quét hàng là sự khác biệt giữa R = x max -x min, tức là giá trị lớn nhất và nhỏ nhất của các tùy chọn này.

Hãy kiểm tra xem chúng ta đã tìm thấy giá trị trung bình của chuỗi này, giá trị trung bình và chế độ một cách chính xác hay chưa, dựa trên các định nghĩa.

Chúng tôi đã đếm số lượng thành viên, có 12 người trong số họ - một số thành viên chẵn, vì vậy bạn cần tìm trung bình cộng của hai số được viết ở giữa, tức là tùy chọn thứ 6 và 7. [2,1 + 2,4] \ 2 \ u003d 2,25 - giá trị trung bình.

Thời trang. Bản mod là 1,2 vì chỉ có con số này xảy ra 3 lần, và số còn lại xảy ra ít hơn 3 lần.

Chúng tôi tìm thấy giá trị trung bình cộng như sau:

[1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5]\12=2,4

Hãy làm một cái bàn

Các bảng như vậy được gọi là bảng tần số. Trong đó, các số của dòng thứ hai là tần số; chúng cho biết tần suất xuất hiện của một hoặc một trong các giá trị của nó trong mẫu.

Sự định nghĩa. Tần số tương đối giá trị mẫu là tỷ lệ giữa tần số của nó với số lượng tất cả các giá trị mẫu.

Tần số tương đối được gọi là tần số khác. Tần số và tần số được gọi là trọng số. Tìm khoảng của dãy số: R = 5-1,2 = 3,8; Phạm vi của chuỗi là 3,8.

Thông tin cho suy nghĩ

Trung bình cộng là một giá trị có điều kiện. Nó không thực sự tồn tại. Trong thực tế, có một tổng số. Do đó, giá trị trung bình số học không phải là đặc điểm của một lần quan sát; nó đặc trưng cho toàn bộ loạt phim.

Nghĩa là có thể được hiểu là trung tâm của sự phân tán các giá trị của đối tượng địa lý được quan sát, tức là giá trị, xung quanh đó tất cả các giá trị quan sát được dao động và tổng đại số của độ lệch so với giá trị trung bình luôn bằng 0, tức là tổng các độ lệch từ giá trị trung bình lên hoặc xuống bằng nhau.

Trung bình là một đại lượng trừu tượng [khái quát hóa]. Ngay cả khi chỉ định một dãy số tự nhiên, giá trị trung bình có thể được biểu thị dưới dạng số phân số. Ví dụ: điểm trung bình của bài kiểm tra là 3,81.

Nghĩa là không chỉ được tìm thấy đối với các đại lượng đồng nhất. Năng suất ngũ cốc trung bình trong cả nước [ngô - 50-60% / ha và kiều mạch - 5-6% / ha, lúa mạch đen, lúa mì, v.v.], tiêu thụ lương thực bình quân, thu nhập quốc dân bình quân trên đầu người, cung nhà ở bình quân, nhà ở bình quân gia quyền chi phí, cường độ lao động bình quân xây dựng công trình, v.v. - đây là những đặc điểm của nhà nước với tư cách là một hệ thống kinh tế đơn lẻ, đây là những cái gọi là mức trung bình của hệ thống.

Trong thống kê, các đặc điểm như vậy được sử dụng rộng rãi như chế độ và trung vị. Chúng được gọi là trung bình cơ cấu, bởi vì giá trị của các đặc điểm này được xác định bởi cấu trúc chung của chuỗi dữ liệu.

Đôi khi một hàng có thể có hai chế độ, đôi khi một hàng có thể không có một chế độ.

Thời trang là chỉ số dễ chấp nhận nhất trong việc xác định bao bì của một số sản phẩm được người mua ưa thích; giá cả đối với hàng hóa loại này, phổ biến trên thị trường; như kích thước giày, quần áo, hầu hết các nhu cầu; một môn thể thao được đa số dân chúng cả nước, thành phố, làng học, v.v. ưa thích.

Trong xây dựng, có 8 lựa chọn về chiều rộng cho tấm, và 3 loại thường được sử dụng hơn: 1 m. 1,2 m và 1,5 m. Có 33 lựa chọn về chiều dài, nhưng tấm dài 4,8 m thường được sử dụng nhiều nhất; 5,7 m và 6,0 m, thời trang bản sàn là phổ biến nhất trong số 3 kích thước này. Điều này cũng có thể nói về nhãn hiệu cửa sổ.

Chế độ của một loạt dữ liệu được tìm thấy khi chúng muốn xác định một số chỉ số tiêu biểu.

Chế độ có thể được thể hiện bằng số và từ, về mặt thống kê, chế độ là cực trị tần số.

Trung bình cho phép bạn xem xét thông tin về một chuỗi dữ liệu, cung cấp giá trị trung bình số học và ngược lại.

Phương pháp thống kê toán học


1. Giới thiệu

Thống kê toán học là một ngành khoa học phát triển các phương pháp thu thập, mô tả và xử lý dữ liệu thực nghiệm để nghiên cứu các dạng của hiện tượng khối lượng ngẫu nhiên.

Trong thống kê toán học, có thể phân biệt hai lĩnh vực: thống kê mô tả và thống kê quy nạp [suy luận thống kê]. Thống kê mô tả liên quan đến việc tích lũy, hệ thống hóa và trình bày dữ liệu thực nghiệm dưới dạng thuận tiện. Thống kê quy nạp trên cơ sở các dữ liệu này cho phép chúng ta rút ra kết luận nhất định về các đối tượng mà dữ liệu được thu thập hoặc ước tính các tham số của chúng.

Các lĩnh vực điển hình của thống kê toán học là:

1] lý thuyết lấy mẫu;

2] lý thuyết về ước lượng;

3] thử nghiệm các giả thuyết thống kê;

4] phân tích hồi quy;

5] phân tích phương sai.

Thống kê toán học dựa trên một số khái niệm ban đầu, nếu thiếu nó thì không thể nghiên cứu các phương pháp xử lý dữ liệu thực nghiệm hiện đại. Trong một số đầu tiên trong số chúng, chúng ta có thể đưa ra khái niệm tổng thể chung và mẫu.

Trong sản xuất công nghiệp hàng loạt, người ta thường xác định chất lượng của sản phẩm có đạt tiêu chuẩn hay không mà không cần kiểm tra từng sản phẩm được sản xuất ra. Do số lượng sản phẩm được sản xuất rất lớn hoặc việc xác minh sản phẩm có liên quan đến việc đưa chúng vào tình trạng hư hỏng, một số lượng nhỏ sản phẩm được kiểm tra. Dựa trên việc kiểm tra này, một kết luận phải được đưa ra trên toàn bộ loạt sản phẩm. Tất nhiên, người ta không thể nói rằng tất cả các bóng bán dẫn từ lô 1 triệu chiếc là tốt hay xấu bằng cách kiểm tra một trong số chúng. Mặt khác, vì quá trình chọn mẫu để thử nghiệm và bản thân các thử nghiệm có thể tốn thời gian và dẫn đến chi phí cao, nên phạm vi xác minh sản phẩm phải sao cho có thể đưa ra một đại diện đáng tin cậy cho toàn bộ lô sản phẩm, được có kích thước tối thiểu. Để kết thúc, chúng tôi xin giới thiệu một số khái niệm.

Toàn bộ tập hợp các đối tượng nghiên cứu hoặc dữ liệu thực nghiệm được gọi là tổng thể chung. Chúng ta sẽ biểu thị bằng N số lượng đối tượng hoặc số lượng dữ liệu tạo nên tổng thể chung. Giá trị của N được gọi là kích thước của quần thể. Nếu N >> 1, tức là N rất lớn, thì N = ¥ thường được coi là.

Mẫu ngẫu nhiên hay đơn giản là mẫu là một phần của tổng thể chung, được chọn ngẫu nhiên từ nó. Từ "ngẫu nhiên" có nghĩa là xác suất chọn bất kỳ đối tượng nào từ tổng thể chung là như nhau. Đây là một giả định quan trọng, tuy nhiên, thường rất khó để kiểm tra nó trong thực tế.

Kích thước mẫu được gọi là số đối tượng hoặc lượng dữ liệu tạo nên mẫu và biểu thị N. Trong tương lai, chúng ta sẽ giả sử rằng các phần tử của mẫu có thể được gán tương ứng là các giá trị số x 1, x 2, ... x n. Ví dụ, trong quá trình kiểm soát chất lượng bóng bán dẫn lưỡng cực được sản xuất, đây có thể là phép đo độ lợi DC của chúng.


2. Đặc điểm số lượng của mẫu

2.1 Mẫu trung bình

Đối với một mẫu cụ thể có kích thước n, mẫu của nó có nghĩa là

được xác định bởi mối quan hệ

trong đó x i là giá trị của các phần tử mẫu. Thông thường, yêu cầu mô tả các thuộc tính thống kê của các mẫu ngẫu nhiên tùy ý, và không phải một trong số chúng. Điều này có nghĩa là một mô hình toán học được xem xét, giả định một số lượng đủ lớn các mẫu có kích thước n. Trong trường hợp này, các phần tử mẫu được coi là biến ngẫu nhiên X i, nhận các giá trị x i với mật độ xác suất f [x], là mật độ xác suất của tổng thể chung. Khi đó, giá trị trung bình của mẫu cũng là một biến ngẫu nhiên

bình đẳng

Như trước đây, chúng ta sẽ biểu thị các biến ngẫu nhiên bằng chữ in hoa và các giá trị của biến ngẫu nhiên bằng chữ thường.

Giá trị trung bình của tổng thể chung mà từ đó mẫu được tạo ra sẽ được gọi là giá trị trung bình chung và được ký hiệu là m x. Có thể mong đợi rằng nếu cỡ mẫu là đáng kể thì giá trị trung bình của mẫu sẽ không khác biệt rõ rệt so với giá trị trung bình chung. Vì giá trị trung bình của mẫu là một biến ngẫu nhiên, bạn có thể tìm thấy kỳ vọng toán học cho nó:

Do đó, kỳ vọng toán học của giá trị trung bình mẫu bằng giá trị trung bình chung. Trong trường hợp này, giá trị trung bình của mẫu được cho là một ước tính không chệch về giá trị trung bình của tổng thể. Chúng tôi sẽ trở lại kỳ này sau. Vì giá trị trung bình mẫu là một biến ngẫu nhiên dao động xung quanh giá trị trung bình chung, nên ước tính biến động này bằng cách sử dụng phương sai của giá trị trung bình mẫu. Hãy xem xét một mẫu có kích thước n nhỏ hơn nhiều so với kích thước của tổng thể chung N [n

Chủ Đề