Bin trong Excel là gì

Trong lĩnh vực kỹ thuật, để nghiên cứu các sự vật, hiện tượng, người ta thường tiến hành đo, cân, ước lượng,... Tuy nhiên, kết quả thu được không bao giờ chính xác một cách tuyệt đối mà dao động xung quanh một giá trị nào đó.
Ví dụ như khi xác định khối lượng của 1 đơn vị thể tích đất đá được coi là giống nhau, ta được 1 tập hợp các giá trị riêng lẻ (trong ví dụ này có 40 mẫu).
Chính vì vậy ta cần phải nghiên cứu quy luật biến đổi của các đại lượng đó bằng cách lập ra biểu đồ phân phối xác suất. Từ đó có thể đánh giá được giá trị gần đúng nhất của đại lượng mà ta nghiên cứu.
Trong Excel, bạn có thể xây dựng được biểu đồ phân phối xác suất (histogram) bằng cách sử dụng tính năng Histogram trong Analysis ToolPak. Bình thường, Excel không cài sẵn Analysis ToolPak. Để cài đặt Analysis ToolPak, bạn chọn Add-Ins trong Tools. Tại cửa sổ Add-Ins, bạn đánh dấu chọn Analysis ToolPak.
Bin trong Excel là gì

Trình tự xây dựng biểu đồ phân phối của đại lượng ngẫu nhiên:
1. Vào giá trị riêng lẻ của đại lượng ngẫu nhiên. Ví dụ trong khoảng C3:C43 (40 đại lượng).
2. Chia vùng phân phối thành các khoảng (gọi là lớp) và được giới hạn bởi các điểm. Ví dụ E3:E10. Giới hạn phải bao kín miền giá trị đơn lẻ. Sự phân lớp không phải tùy tiện mà có quy định cụ thể. Số lượng lớp (m) tối thiểu được xác định gần đúng như sau:
m = 1 + 3.32 logn
Trong đó n là số lượng các giá trị riêng lẻ.
3. Chọn Data Analysis trong Tools. Trong cửa sổ Data Analysis chọn Histogram.
Bin trong Excel là gì


Bin trong Excel là gì

4. Khi cửa sổ Histogram hiện ra, bạn khai báo như sau:
- Input range: vào vùng giá trị, C3:C43
- Bin range: vào vùng giới hạn lớp, E3:E10
- Output range: chọn điểm đầu của kết quả, E12.
- Cumulative Percentage: Lập biểu đồ phần trăm tích luỹ.
- Chart Output: Lập biểu đồ phân phối xác suất.
Với một đại lượng ngẫu nhiên (như ví dụ trên) tuân theo quy luật phân phối chuẩn (biểu diễn đồ thị ở dạng XY thì dễ nhìn hơn), phân phối có dạng hình chuông (phân phối chuẩn Gaoxơ).
Tâm phân phối chính là giá trị có tần suất lớn nhất và thường là giá trị kỳ vọng (hay gọi là giá trị trung bình của tập hợp). Nó giao với trục hoành ở -vô cùng và +vô cùng.

Từ ví dụ trên, các bạn thấy các giá trị có tần suất lớn thường ở gần tâm phân phối. Các giá trị có tần suất nhỏ thường nằm xa tâm phân phối.

Người ta cũng chứng minh được rằng, trong khoảng lân cận 3*(Độ lệch bình phương trung bình- Mời các bạn xem thêm hàm STDEV) của kỳ vọng (giá trị TB), có tới 99.74% các giá trị của đại lượng ngẫu nhiên rơi vào.

Những giá trị nằm ngoài khoảng đó không đặc trưng cho phân phối và được coi là sai số. Giá trị sai số đó thường được loại bỏ khi chỉnh lý thống kê.

Bạn nào quan tâm thì tải file kèm theo.

Xin lỗi! Tôi sẽ tải sau vì hết nguồn rồi.