Exact Moments of Residuals of Independence

Qu, Xianggui

doi:10.3390/math12243987

Open AccessArticle

Exact Moments of Residuals of Independence

by

Xianggui Qu

Department of Mathematics and Statistics, Oakland University, 146 Library Drive, Rochester, MI 48309, USA

Mathematics 2024, 12(24), 3987; https://doi.org/10.3390/math12243987

Submission received: 27 November 2024 / Revised: 10 December 2024 / Accepted: 18 December 2024 / Published: 18 December 2024

(This article belongs to the Section D1: Probability and Statistics)

Download Versions Notes

Abstract

The diagnosis of residuals of independence is critical in association analysis and loglinear modeling of two-way contingency tables. Most residual diagnostics depend on large-sample methods, and diagnostic results become dubious when sample sizes are small or data are sparse. In such cases, statistical inference based on non-asymptotic theory or exact inference is desirable. This paper explicitly derives the first four moments of the residuals of independence in a two-way contingency table under a multinomial model. These exact moments are necessary tools for studying the analytical features of the distribution of residuals of independence, such as skewness and kurtosis. Higher-order moments can be found similarly, but the results are more complicated.

Keywords:

exact kurtosis; exact moments; exact skewness; residual of independence

MSC:

62F99; 62F10

1. Introduction

Testing independence has been popularly applied in the association analysis of two-way contingency tables from cross-sectional studies and other statistical applications. Ref. [1] investigated the association between levels of paternal education (completed university, partially completed university, completed secondary education, and not completed secondary education) and quartiles of neonatal weight gain (

Q_{1}

: lowest

25 %

;

Q_{2}

: second lowest

25 %

;

Q_{3}

: second highest

25 %

; and

Q_{4}

: highest

25 %

) from a cross-sectional study involving 13,262 Belarusian infants born at or over 37 weeks of gestation and weighing at or over 2500 g. Table 1 provides the observed frequencies and the expected frequencies under independence (in parentheses).

With an observed

χ^{2}

statistic value of

19.016

and nine degrees of freedom, the p-value for testing the independence between levels of paternal education and quartiles of neonatal weight gain is

0.025

. At the

0.05

level of significance, the data reject the independence of the levels of paternal education and the quartiles of neonatal weight gain. The nature of a dependence is usually revealed by the distribution of differences between the observed and expected frequencies, i.e., residuals of independence. For example, the number of subjects with the highest

25 %

neonatal weight gain and partial university paternal education exceeds the expected number, while the number of subjects with the highest

25 %

neonatal weight gain and secondary paternal education subceeds the expected value.

Since the analytical form of the distribution of the residuals of independence is not available, the first four moments of the distribution provide vital information about the center, spread, skewness, and kurtosis of the distribution. For example, standardized residuals of independence are commonly used to reduce the heterogeneity from cell to cell. Standardization is usually carried out with the asymptotic mean and variance of the residuals. Non-asymptotic and explicit expressions of the mean and variance of the residuals of independence seem to be missing in the literature. This paper explicitly derives the first four raw moments of the residuals of independence under a multinomial model.

2. Main Results

Consider the following

r \times c

table:

	1	2	⋯	$c - 1$	c	Total
1	$n_{11}$	$n_{12}$	⋯	$n_{1 (c - 1)}$	$n_{1 c}$	$n_{1 +}$
2	$n_{21}$	$n_{22}$	⋯	$n_{2 (c - 1)}$	$n_{2 c}$	$n_{2 +}$
⋮	⋮	⋮	⋮	⋮	⋮	⋮
$r - 1$	$n_{(r - 1) 1}$	$n_{(r - 1) 2}$	⋯	$n_{(r - 1) (c - 1)}$	$n_{(r - 1) c}$	$n_{(r - 1) +}$
r	$n_{r 1}$	$n_{r 2}$	⋯	$n_{r (c - 1)}$	$n_{r c}$	$n_{r +}$
Total	$n_{+ 1}$	$n_{+ 2}$	⋯	$n_{+ (c - 1)}$	$n_{+ c}$	$n_{+ +}$

The residual of independence of cell

(i, j)

is defined as

n_{i j} - \frac{n_{i +} n_{+ j}}{n_{+ +}} .

Assume that

(n_{11}, \dots, n_{r c})

follows a multinomial distribution with

n_{+ +}

trials and a probability of

π_{i j}

for cell

(i, j)

for

i = 1, 2, \dots, r

and

j = 1, 2, \dots, c,

where

π_{11} + \dots + π_{r c} = 1,

i.e.,

(n_{11}, \dots, n_{r c}) \sim Multinomial (n_{+ +}; π_{11}, \dots, π_{r c}) .

The following factorial moments of a multinomial distribution are taken from [2] and can be proven straightforwardly.

Lemma 1.

Assume that

(T_{1}, T_{2}, \dots, T_{k - 1}, T_{k}) \sim M u l t i n o m i a l (n; π_{1}, π_{2}, \dots, π_{k - 1}, π_{k}) .

For any nonnegative integer m and random variable

X,

let

X^{(m)} = X (X - 1) \dots, (X - m + 1) .

Then, for nonnegative integers

m_{1},

\dots,

m_{k},

we have

E [T_{1}^{(m_{1})} T_{2}^{(m_{2})} \dots T_{k}^{(m_{k})}] = n^{(\sum_{i = 1}^{k} m_{i})} π_{1}^{m_{1}} π_{2}^{m_{2}} \dots π_{k}^{m_{k}} .

In particular,

\begin{matrix} E (T_{i}) = n π_{i}, i = 1, 2, \dots, k; \\ E (T_{i}^{2}) = n (n - 1) π_{i}^{2} + n π_{i}, i = 1, 2, \dots, k; \\ E (T_{i} T_{j}) = n (n - 1) π_{i} π_{j}, i \neq j, i, j = 1, 2, \dots, k; \\ E (T_{i}^{3}) = n (n - 1) (n - 2) π_{i}^{3} + 3 n (n - 1) π_{i}^{2} + n π_{i}, i = 1, 2, \dots, k; \\ E (T_{i}^{2} T_{j}) = n (n - 1) (n - 2) π_{i}^{2} π_{j} + n (n - 1) π_{i} π_{j}, i \neq j, i, j = 1, 2, \dots, k; \\ E (T_{i} T_{j} T_{l}) = n (n - 1) (n - 2) π_{i} π_{j} π_{l}, i \neq j \neq l, i, j, l = 1, 2, \dots, k; \\ E (T_{i}^{4}) = n (n - 1) (n - 2) (n - 3) π_{i}^{4} + 6 n (n - 1) (n - 2) π_{i}^{3} + 7 n (n - 1) π_{i}^{2} + n π_{i}, \\ i = 1, 2, \dots, k; \\ E (T_{i}^{3} T_{j}) = n (n - 1) (n - 2) (n - 3) π_{i}^{3} π_{j} + 3 n (n - 1) (n - 2) π_{i}^{2} π_{j} + n (n - 1) π_{i} π_{j}, \\ i \neq j, i, j = 1, 2, \dots, k; \\ E (T_{i}^{2} T_{j}^{2}) = n (n - 1) (n - 2) (n - 3) π_{i}^{2} π_{j}^{2} + n (n - 1) (n - 2) (π_{i}^{2} π_{j} + π_{i} π_{j}^{2}) + n (n - 1) π_{i} π_{j}, \\ i \neq j, i, j = 1, 2, \dots, k; \\ E (T_{i}^{2} T_{j} T_{l}) = n (n - 1) (n - 2) (n - 3) π_{i}^{2} π_{j} π_{l} + n (n - 1) (n - 2) π_{i} π_{j} π_{l}, \\ i \neq j \neq l, i, j, l = 1, 2, \dots, k; \\ E (T_{i} T_{j} T_{l} T_{m}) = n (n - 1) (n - 2) (n - 3) π_{i} π_{j} π_{l} π_{m}, i \neq j \neq l \neq m, i, j, l, m = 1, 2, \dots, k . \\ V a r (T_{i} T_{j}) = n (n - 1) (6 - 4 n) π_{i}^{2} π_{j}^{2} + n (n - 1) (n - 2) (π_{i}^{2} π_{j} + π_{i} π_{j}^{2}) + n (n - 1) π_{i} π_{j}, \\ i \neq j, i, j = 1, 2, \dots, k; \\ C o v (T_{i} T_{j}, T_{l} T_{m}) = n (n - 1) (6 - 4 n) π_{i} π_{j} π_{l} π_{m}, i \neq j \neq l \neq m, i, j, l, m = 1, 2, \dots, k . \end{matrix}

The next result is taken from [3] and can be proven directly from the definition of multinomial distribution.

Lemma 2.

Assume that

(T_{1}, T_{2}, \dots, T_{k - 1}, T_{k}) \sim M u l t i n o m i a l (n; π_{1}, π_{2}, \dots, π_{k - 1}, π_{k})

and

S_{1},

S_{2},

\dots,

S_{m}

is a set partition of

{1, 2, \dots, k} .

Let

X_{i} = \sum_{j \in S_{i}} T_{j},

p_{i} = \sum_{j \in S_{i}} π_{j} .

Then,

(X_{1}, \dots, X_{m}) \sim M u l t i n o m i a l (n; p_{1}, p_{2}, \dots, p_{m}) .

The mean and variance of the residuals of independence are given below.

Theorem 1.

Assume that

(n_{11}, \dots, n_{r c}) \sim M u l t i n o m i a l (n_{+ +}; π_{11}, \dots, π_{r c}),

where

n_{+ +} = \sum_{i = 1}^{r} \sum_{j = 1}^{c} n_{i j}

is a constant,

π_{i j} \geq 0,

for

i = 1, \dots, r,

j = 1, \dots, c,

and

\sum_{i = 1}^{r} \sum_{j = 1}^{c} π_{i j} = 1 .

For any

i = 1, \dots, r

and

j = 1, \dots, c,

consider the residual of independence of cell

(i, j),

R_{i j} = n_{i j} - \frac{n_{i +} n_{+ j}}{n_{+ +}},

where

n_{i +} = \sum_{j = 1}^{c} n_{i j}

and

n_{+ j} = \sum_{i = 1}^{r} n_{i j} .

We have, for

i = 1, \dots, r

and

j = 1, \dots, c,

\begin{matrix} μ = E (R_{i j}) = (n_{+ +} - 1) (π_{i j} - π_{i +} π_{+ j}), \\ σ^{2} = V a r (R_{i j}) = \frac{n_{+ +} - 1}{n_{+ +}} \{(6 - 4 n_{+ +}) {(π_{i j} - π_{i +} π_{+ j})}^{2} \\ - (n_{+ +} - 2) (π_{i j} - π_{i +} π_{+ j}) (π_{i +} + π_{+ j} - 2 π_{i j}) \\ + (n_{+ +} - 1) π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})\}, a n d \\ E (R_{i j}^{2}) = \frac{n_{+ +} - 1}{n_{+ +}} \{(n_{+ +} - 2) (n_{+ +} - 3) {(π_{i j} - π_{i +} π_{+ j})}^{2} \\ - (n_{+ +} - 2) (π_{i j} - π_{i +} π_{+ j}) (π_{i +} + π_{+ j} - 2 π_{i j}) \\ + (n_{+ +} - 1) π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})\} . \end{matrix}

where

π_{i +} = \sum_{j = 1}^{c} π_{i j}

and

π_{+ j} = \sum_{i = 1}^{r} π_{i j} .

When independence holds, i.e.,

π_{i j} = π_{i +} π_{+ j},

V a r (R_{i j}) = (n_{+ +} - 1) π_{i +} π_{+ j} (1 - π_{i +}) (1 - π_{+ j}) .

Proof.

For any

i = 1, 2, \dots, r

and

j = 1, 2, \dots, c,

note that

\begin{matrix} E (n_{i +} n_{+ j}) = E (\sum_{s \neq i}^{r} n_{s j} \sum_{t \neq j}^{c} n_{i t} + \sum_{s \neq i}^{r} n_{i j} n_{s j} + \sum_{t \neq j}^{c} n_{i j} n_{i t} + n_{i j}^{2}) \\ = \sum_{s \neq i}^{r} \sum_{t \neq j}^{c} E (n_{s j} n_{i t}) + \sum_{s \neq i}^{r} E (n_{i j} n_{s j}) + \sum_{t \neq j}^{c} E (n_{i j} n_{i t}) + E (n_{i j}^{2}) \\ = \sum_{s \neq i}^{r} \sum_{t \neq j}^{c} n_{+ +} (n_{+ +} - 1) π_{s j} π_{i t} + \sum_{s \neq i}^{r} n_{+ +} (n_{+ +} - 1) π_{i j} π_{s j}) \\ + \sum_{t \neq j}^{c} n_{+ +} (n_{+ +} - 1) π_{i j} π_{i t} + n_{+ +} (n_{+ +} - 1) π_{i j}^{2} + n_{+ +} π_{i j} \\ = n_{+ +} (n_{+ +} - 1) \sum_{s = 1}^{r} π_{s j} \sum_{t = 1}^{c} π_{i t} + n_{+ +} π_{i j} \\ = n_{+ +} (n_{+ +} - 1) π_{i +} π_{+ j} + n_{+ +} π_{i j} \end{matrix}

Recall that

E (n_{i j}) = n_{+ +} π_{i j},

so we have

E (R_{i j}) = n_{+ +} π_{i j} - \frac{n_{+ +} (n_{+ +} - 1) π_{i +} π_{+ j} + n_{+ +} π_{i j}}{n_{+ +}} = (n_{+ +} - 1) (π_{i j} - π_{i +} π_{+ j}) .

To calculate the variance of

R_{i j},

let

n_{i *} = n_{i +} - n_{i j},

n_{* j} = n_{+ j} - n_{i j},

π_{i *} = π_{i +} - π_{i j},

and

π_{* j} = π_{+ j} - π_{i j} .

Then,

R_{i j} = \frac{1}{n_{+ +}} [n_{i j} (n_{+ +} - n_{i j} - n_{i *} - n_{* j}) - n_{i *} n_{* j}] .

For any

i = 1, \dots, r,

j = 1, \dots, c

and

i \neq j,

\begin{matrix} V a r (R_{i j}) = \frac{1}{n_{+ +}^{2}} {V a r [n_{i j} (n_{+ +} - n_{i *} - n_{* j} - n_{i j})] \\ - 2 C o v (n_{i j} (n_{+ +} - n_{i *} - n_{* j} - n_{i j}), n_{i *} n_{* j}) + V a r (n_{i *} n_{* j})} \\ = \frac{1}{n_{+ +}^{2}} {n_{+ +} (n_{+ +} - 1) (6 - 4 n_{+ +}) π_{i j}^{2} {(1 - π_{i *} - π_{* j} - π_{i j})}^{2} \\ + n_{+ +} (n_{+ +} - 1) (n_{+ +} - 2) [π_{i j}^{2} (1 - π_{i *} - π_{* j} - π_{i j}) + π_{i j} {(1 - π_{i *} - π_{* j} - π_{i j})}^{2}] \\ + n_{+ +} (n_{+ +} - 1) π_{i j} (1 - π_{i *} - π_{* j} - π_{i j}) \\ - 2 n_{+ +} (n_{+ +} - 1) (6 - 4 n_{+ +}) π_{i j} (1 - π_{i *} - π_{* j} - π_{i j}) π_{i *} π_{* j} \\ + n_{+ +} (n_{+ +} - 1) (6 - 4 n_{+ +}) π_{i *}^{2} π_{* j}^{2} + n_{+ +} (n_{+ +} - 1) (n_{+ +} - 2) (π_{i *}^{2} π_{* j} + π_{i *} π_{* j}^{2}) \\ + n_{+ +} (n_{+ +} - 1) π_{i *} π_{* j}} \\ = \frac{n_{+ +} - 1}{n_{+ +}} {(6 - 4 n_{+ +}) {[π_{i j} (1 - π_{i *} - π_{* j} - π_{i j}) - π_{i *} π_{* j}]}^{2} \\ + (n_{+ +} - 2) [π_{i j}^{2} (1 - π_{i *} - π_{* j} - π_{i j}) + π_{i j} {(1 - π_{i *} - π_{* j} - π_{i j})}^{2} + π_{i *}^{2} π_{* j} + π_{i *} π_{* j}^{2}] \\ + π_{i j} (1 - π_{i *} - π_{* j} - π_{i j}) + π_{i *} π_{* j}} \\ = \frac{n_{+ +} - 1}{n_{+ +}} {(6 - 4 n_{+ +}) {(π_{i j} - π_{i +} π_{+ j})}^{2} \\ + (n_{+ +} - 2) [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (1 - π_{i +} - π_{+ j} + 2 π_{i j}) \\ + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) (π_{i +} + π_{+ j} - 2 π_{i j})] \\ + π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})} \\ = \frac{n_{+ +} - 1}{n_{+ +}} {(6 - 4 n_{+ +}) {(π_{i j} - π_{i +} π_{+ j})}^{2} \\ + (n_{+ +} - 2) [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) - (π_{i j} - π_{i +} π_{+ j}) (π_{i +} + π_{+ j} - 2 π_{i j})] \\ + π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})} \\ = \frac{n_{+ +} - 1}{n_{+ +}} {(6 - 4 n_{+ +}) {(π_{i j} - π_{i +} π_{+ j})}^{2} - (n_{+ +} - 2) (π_{i j} - π_{i +} π_{+ j}) (π_{i +} + π_{+ j} - 2 π_{i j}) \\ + (n_{+ +} - 1) π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})} . \end{matrix}

The second moment can be obtained by noting

E (R_{i j}^{2}) = V a r (R_{i j} + {[E (R_{i j})]}^{2} .

When independence holds, i.e.,

π_{i j} = π_{i +} π_{+ j},

it is straightforward to see that

E (R_{i j}) = 0

and

V a r (R_{i j}) = (n_{+ +} - 1) π_{i +} π_{+ j} (1 - π_{i +}) (1 - π_{+ j}) .

□

Based on the exact variance of the residuals of independence above, the standardized residual of independence of cell

(i, j)

is

\frac{n_{i j} - n_{i +} n_{+ j} / n_{+ +}}{\sqrt{(n_{+ +} - 1) (1 - n_{i +} / n_{+ +}) (1 - n_{+ j} / n_{+ +}) n_{i +} n_{+ j} / n_{+ +}^{2}}} .

This exact standardized residual is asymptotically equivalent to

\frac{n_{i j} - n_{i +} n_{+ j} / n_{+ +}}{\sqrt{(1 - n_{i +} / n_{+ +}) (1 - n_{+ j} / n_{+ +}) n_{i +} n_{+ j} / n_{+ +}}}

, which is used in many textbooks, e.g., [4].

In order to derive the third and fourth moments of

R_{i j},

we need higher-order mixed moments. However, the derivation of higher-order mixed moments from higher-order factorial moments in Lemma 1 is too tedious. Using the differential relationships between the moment-generating function of a distribution and its moments as well as the computer algebra system Wolfram|Alpha, we obtain the following Lemma 3.

Lemma 3.

Assume that

(T_{1}, T_{2}, \dots, T_{k - 1}, T_{k}) \sim M u l t i n o m i a l (n; π_{1}, π_{2}, \dots, π_{k - 1}, π_{k}) .

For any nonnegative integer

m,

let

n^{(m)} = n (n - 1) \dots (n - m + 1) .

Then,

\begin{matrix} E (T_{i}^{3} T_{j}^{3}) = n^{(6)} π_{i}^{3} π_{j}^{3} + 3 n^{(5)} π_{i}^{3} π_{j}^{2} + 3 n^{(5)} π_{i}^{2} π_{j}^{3} + n^{(4)} π_{i}^{3} π_{j} + n^{(4)} π_{i} π_{j}^{3} + 9 n^{(4)} π_{i}^{2} π_{j}^{2} \\ + 3 n^{(3)} π_{i}^{2} π_{j} + 3 n^{(3)} π_{i} π_{j}^{2} + n^{(2)} π_{i} π_{j}, i \neq j, i, j = 1, 2, \dots, k; \\ E (T_{i}^{2} T_{j}^{2} T_{l} T_{h}) = n^{(6)} π_{i}^{2} π_{j}^{2} π_{l} π_{h} + n^{(5)} π_{i}^{2} π_{j} π_{l} π_{h} + n^{(5)} π_{i} π_{j}^{2} π_{l} π_{h} + n^{(4)} π_{i} π_{j} π_{l} π_{h}, \\ i \neq j \neq l \neq h, i, j, l, h = 1, 2, \dots, k; \\ E (T_{i}^{4} T_{j}^{4}) = n^{(8)} π_{i}^{4} π_{j}^{4} + 6 n^{(7)} π_{i}^{4} π_{j}^{3} + 6 n^{(7)} π_{i}^{3} π_{j}^{4} + 7 n^{(6)} π_{i}^{4} π_{j}^{2} + 7 n^{(6)} π_{i}^{2} π_{j}^{4} + 36 n^{(6)} π_{i}^{3} π_{j}^{3} \\ + 42 n^{(5)} π_{i}^{3} π_{j}^{2} + 42 n^{(5)} π_{i}^{2} π_{j}^{3} + n^{(5)} π_{i}^{4} π_{j} + n^{(5)} π_{i} π_{j}^{4} + 6 n^{(4)} π_{i}^{3} π_{j} + 6 n^{(4)} π_{i} π_{j}^{3} + 49 n^{(4)} π_{i}^{2} π_{j}^{2} \\ + 7 n^{(3)} π_{i}^{2} π_{j} + 7 n^{(3)} π_{i} π_{j}^{2} + n^{(2)} π_{i} π_{j}, i \neq j, i, j = 1, 2, \dots, k; \\ E (T_{i}^{3} T_{j}^{3} T_{l} T_{h}) = n^{(8)} π_{i}^{3} π_{j}^{3} π_{l} π_{h} + 3 n^{(7)} π_{i}^{3} π_{j}^{2} π_{l} π_{h} + 3 n^{(7)} π_{i}^{2} π_{j}^{3} π_{l} π_{h} + n^{(6)} π_{i}^{3} π_{j} π_{l} π_{h} \\ + n^{(6)} π_{i} π_{j}^{3} π_{l} π_{h} + 9 n^{(6)} π_{i}^{2} π_{j}^{2} π_{l} π_{h} + 3 n^{(5)} π_{i}^{2} π_{j} π_{l} π_{h} + 3 n^{(5)} π_{i} π_{j}^{2} π_{l} π_{h} + n^{(4)} π_{i} π_{j} π_{l} π_{h}, \\ i \neq j \neq l \neq h, i, j, l, h = 1, 2, \dots, k; \\ E (T_{i}^{2} T_{j}^{2} T_{l}^{2} T_{h}^{2}) = n^{(8)} π_{i}^{2} π_{j}^{2} π_{l}^{2} π_{h}^{2} + n^{(7)} π_{i}^{2} π_{j}^{2} π_{l}^{2} π_{h} + n^{(7)} π_{i}^{2} π_{j}^{2} π_{l} π_{h}^{2} + n^{(7)} π_{i}^{2} π_{j} π_{l}^{2} π_{h}^{2} \\ + n^{(7)} π_{i} π_{j}^{2} π_{l}^{2} π_{h}^{2} + n^{(6)} π_{i}^{2} π_{j}^{2} π_{l} π_{h} + n^{(6)} π_{i}^{2} π_{j} π_{l}^{2} π_{h} + n^{(6)} π_{i}^{2} π_{j} π_{l} π_{h}^{2} + n^{(6)} π_{i} π_{j}^{2} π_{l}^{2} π_{h} \\ + n^{(6)} π_{i} π_{j}^{2} π_{l} π_{h}^{2} + n^{(6)} π_{i} π_{j} π_{l}^{2} π_{h}^{2} + n^{(5)} π_{i}^{2} π_{j} π_{l} π_{h} + n^{(5)} π_{i} π_{j}^{2} π_{l} π_{h} + n^{(5)} π_{i} π_{j} π_{l}^{2} π_{h} \\ + n^{(5)} π_{i} π_{j} π_{l} π_{h}^{2} + n^{(4)} π_{i} π_{j} π_{l} π_{h}, i \neq j \neq l \neq h, i, j, l, h = 1, 2, \dots, k . \end{matrix}

Proof.

Since

(T_{1}, T_{2}, \dots, T_{k - 1}, T_{k}) \sim M u l t i n o m i a l (n; π_{1}, π_{2}, \dots, π_{k - 1}, π_{k}),

its moment-generating function is

M (t_{1}, \dots, t_{k}) = E e^{t_{1} T_{1} + \dots + t_{k} T_{k}} = {(π_{1} e^{t_{1}} + \dots + π_{k} e^{t_{k}})}^{n_{+ +}} .

The results are obtained by noting that

E (T_{i}^{r} T_{j}^{s} T_{l}^{u} T_{h}^{v}) = \frac{\partial^{r + s + u + v} M (t_{1}, \dots, t_{k})}{\partial t_{i}^{r} \partial t_{j}^{s} \partial t_{l}^{u} \partial t_{h}^{v}} |_{t_{1} = 0, \dots, t_{k} = 0}

for

i \neq j \neq l \neq h, i, j, l, h = 1, 2, \dots, k,

and nonnegative intergers

r,

s,

u,

and

v .

□

Theorem 2 next provides the explicit expressions of the third and fourth moments of the residuals of independence.

Theorem 2.

Assume that

(n_{11}, \dots, n_{r c}) \sim M u l t i n o m i a l (n_{+ +}; π_{11}, \dots, π_{r c}),

where

n_{+ +} = \sum_{i = 1}^{r} \sum_{j = 1}^{c} n_{i j}

is a constant,

π_{i j} \geq 0,

for

i = 1, \dots, r,

j = 1, \dots, c,

and

\sum_{i = 1}^{r} \sum_{j = 1}^{c} π_{i j} = 1 .

For any

i = 1, \dots, r

and

j = 1, \dots, c,

consider the residual of independence of cell

(i, j),

R_{i j} = n_{i j} - \frac{n_{i +} n_{+ j}}{n_{+ +}},

where

n_{i +} = \sum_{j = 1}^{c} n_{i j}

and

n_{+ j} = \sum_{i = 1}^{r} n_{i j} .

We have, for

i = 1, \dots, r

and

j = 1, \dots, c,

and

i \neq j,

\begin{matrix} n_{+ +}^{3} E (R_{i j}^{3}) = n_{+ +}^{(6)} {(π_{i j} - π_{i +} π_{+ j})}^{3} \\ - 3 n_{+ +}^{(5)} {(π_{i j} - π_{i +} π_{+ j})}^{2} (π_{i +} + π_{+ j} - 2 π_{i j}) \\ + 3 n_{+ +}^{(5)} π_{i j} (π_{i j} - π_{i +} π_{+ j}) (1 - π_{i +} - π_{+ j} + π_{i j}) \\ + n_{+ +}^{(4)} [π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) - (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3} \\ + 9 π_{i j} (π_{i j} - π_{i +} π_{+ j}) (1 - π_{i +} - π_{+ j} + π_{i j}) + 9 (π_{i j} - π_{i +} π_{+ j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})] \\ + 3 n_{+ +}^{(3)} [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (1 - π_{i +} - π_{+ j} + 2 π_{i j}) \\ - (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) (π_{i +} + π_{+ j} - 2 π_{i j})] \\ + (π_{i j} - π_{i +} π_{+ j}) . \\ n_{+ +}^{4} E {(R_{i j})}^{4} = n_{+ +}^{(8)} {(π_{i j} - π_{i +} π_{+ j})}^{4} \\ + n_{+ +}^{(7)} [6 π_{i j}^{4} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} + 6 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ - 12 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 12 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ - 12 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{2} \\ - 12 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{3} \\ + 6 {(π_{i +} - π_{i j})}^{4} {(π_{+ j} - π_{i j})}^{3} + 6 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{4}] \\ + n_{+ +}^{(6)} [7 π_{i j}^{4} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} + 7 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ + 36 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - 4 π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 4 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 30 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ - 30 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ - 4 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) \\ - 4 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3} \\ + 7 {(π_{i +} - π_{i j})}^{4} {(π_{+ j} - π_{i j})}^{2} + 7 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{4} + 36 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(5)} [π_{i j}^{4} (1 - π_{i +} - π_{+ j} + π_{i j}) + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ + 42 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} + 42 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 6 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ - 6 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + {(π_{i +} - π_{i j})}^{4} (π_{+ j} - π_{i j}) + (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{4} + 42 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{2} \\ + 42 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(4)} [6 π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) + 49 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} - 2 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) + 49 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} + 6 (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(3)} [7 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) + 7 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} \\ + 7 {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) + 7 (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2}] \\ + n_{+ +}^{(2)} [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})] \end{matrix}

where

n_{+ +}^{(m)} = n_{+ +} (n_{+ +} - 1) \dots (n_{+ +} - m + 1)

for any nonnegative integer

m .

Proof.

Let

n_{i *} = n_{i +} - n_{i j},

n_{* j} = n_{+ j} - n_{i j},

π_{i *} = π_{i +} - π_{i j},

and

π_{* j} = π_{+ j} - π_{i j} .

Then,

\begin{matrix} R_{i j} & = \frac{1}{n_{+ +}} [n_{i j} (n_{+ +} - n_{i j} - n_{i *} - n_{* j}) - n_{i *} n_{* j}] . \\ E {(R_{i j})}^{3} & = \frac{1}{n_{+ +}^{3}} E {[n_{i j} (n_{+ +} - n_{i j} - n_{i *} - n_{* j}) - n_{i *} n_{* j}]}^{3} \\ = \frac{1}{n_{+ +}^{3}} {E [n_{i j}^{3} {(n_{+ +} - n_{i j} - n_{i *} - n_{* j})}^{3}] - 3 E [n_{i j}^{2} {(n_{+ +} - n_{i j} - n_{i *} - n_{* j})}^{2} n_{i *} n_{* j}] \\ + 3 E [n_{i j} (n_{+ +} - n_{i j} - n_{i *} - n_{* j}) n_{i *}^{2} n_{* j}^{2}] - E (n_{i *}^{3} n_{* j}^{3})} \end{matrix}

Since

(n_{i j}, n_{i *}, n_{* j}, n_{+ +} - n_{i j} - n_{i *} - n_{* j}) \sim M u l t i n o m i a l (π_{i j}, π_{i *}, π_{* j}, 1 - π_{i j} - π_{i *} - π_{* j}),

we have, from Lemma 3,

\begin{matrix} E [n_{i j}^{3} {(n_{+ +} - n_{i j} - n_{i *} - n_{* j})}^{3}] = n_{+ +}^{(6)} π_{i j}^{3} {(1 - π_{i j} - π_{i *} - π_{* j})}^{3} \\ + 3 n_{+ +}^{(5)} π_{i j}^{3} {(1 - π_{i j} - π_{i *} - π_{* j})}^{2} + 3 n_{+ +}^{(5)} π_{i j}^{2} {(1 - π_{i j} - π_{i *} - π_{* j})}^{3} \\ + n_{+ +}^{(4)} π_{i j}^{3} (1 - π_{i j} - π_{i *} - π_{* j}) + n_{+ +}^{(4)} π_{i j} {(1 - π_{i j} - π_{i *} - π_{* j})}^{3} \\ + 9 n_{+ +}^{(4)} π_{i j}^{2} {(1 - π_{i j} - π_{i *} - π_{* j})}^{2} + 3 n_{+ +}^{(3)} π_{i j}^{2} (1 - π_{i j} - π_{i *} - π_{* j}) \\ + 3 n_{+ +}^{(3)} π_{i j} {(1 - π_{i j} - π_{i *} - π_{* j})}^{2} + n_{+ +}^{(2)} π_{i j} (1 - π_{i j} - π_{i *} - π_{* j}) . \\ E [n_{i j}^{2} {(n_{+ +} - n_{i j} - n_{i *} - n_{* j})}^{2} n_{i *} n_{* j}] = n_{+ +}^{(6)} π_{i j}^{2} {(1 - π_{i j} - π_{i *} - π_{* j})}^{2} π_{i *} π_{* j} \\ + n_{+ +}^{(5)} π_{i j}^{2} (1 - π_{i j} - π_{i *} - π_{* j}) π_{i *} π_{* j} + n_{+ +}^{(5)} π_{i j} {(1 - π_{i j} - π_{i *} - π_{* j})}^{2} π_{i *} π_{* j} \\ + n_{+ +}^{(4)} π_{i j} (1 - π_{i j} - π_{i *} - π_{* j}) π_{i *} π_{* j} . \\ E [n_{i j} (n_{+ +} - n_{i j} - n_{i *} - n_{* j}) n_{i *}^{2} n_{* j}^{2}] = n_{+ +}^{(6)} π_{i j} (1 - π_{i j} - π_{i *} - π_{* j}) π_{i *}^{2} π_{* j}^{2} \\ + n_{+ +}^{(5)} π_{i j} (1 - π_{i j} - π_{i *} - π_{* j}) π_{i *}^{2} π_{* j} + n_{+ +}^{(5)} π_{i j} (1 - π_{i j} - π_{i *} - π_{* j}) π_{i *} π_{* j}^{2} \\ + n_{+ +}^{(4)} π_{i j} (1 - π_{i j} - π_{i *} - π_{* j}) π_{i *} π_{* j} . \\ E [n_{i *}^{3} n_{* j}^{3}] = n_{+ +}^{(6)} π_{i *}^{3} π_{* j}^{3} + 3 n_{+ +}^{(5)} π_{i *}^{3} π_{* j}^{2} + 3 n_{+ +}^{(5)} π_{i *}^{2} π_{* j}^{3} \\ + n_{+ +}^{(4)} π_{i *}^{3} π_{* j} + n_{+ +}^{(4)} π_{i *} π_{* j}^{3} + 9 n_{+ +}^{(4)} π_{i *}^{2} π_{* j}^{2} + 3 n_{+ +}^{(3)} π_{i *}^{2} π_{* j} + 3 n_{+ +}^{(3)} π_{i *} π_{* j}^{2} + n_{+ +}^{(2)} π_{i *} π_{* j} . \end{matrix}

The result is obtained by noting

π_{i *} = π_{i +} - π_{i j},

π_{* j} = π_{+ j} - π_{i j},

\begin{matrix} π_{i j} (1 - π_{i j} - π_{i *} - π_{* j}) - π_{i *} π_{* j} = π_{i j} - π_{i +} π_{+ j}, \\ π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} \\ - {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) - (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ = π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) - (π_{i j} - π_{i +} π_{+ j}) (π_{i +} + π_{+ j} - 2 π_{i j}) . \end{matrix}

The fourth moment is obtained from Lemma 3 and the following:

\begin{matrix} E {(R_{i j})}^{4} & = \frac{1}{n_{+ +}^{4}} E {[n_{i j} (n_{+ +} - n_{i j} - n_{i *} - n_{* j}) - n_{i *} n_{* j}]}^{4} \\ = \frac{1}{n_{+ +}^{4}} {E [n_{i j}^{4} {(n_{+ +} - n_{i j} - n_{i *} - n_{* j})}^{4}] - 4 E [n_{i j}^{3} {(n_{+ +} - n_{i j} - n_{i *} - n_{* j})}^{3} n_{i *} n_{* j}] \\ + 6 E [n_{i j}^{2} {(n_{+ +} - n_{i j} - n_{i *} - n_{* j})}^{2} n_{i *}^{2} n_{* j}^{2}] - 4 E [n_{i j} (n_{+ +} - n_{i j} - n_{i *} - n_{* j}) n_{i *}^{3} n_{* j}^{3}] \\ + E (n_{i *}^{4} n_{* j}^{4})} . \end{matrix}

□

The exact third and fourth central moments can be derived straightforwardly by noting

E {(R_{i j} - μ)}^{3} = E (R_{i j}^{3}) - 3 μ E (R_{i j}^{2}) + 2 μ^{3}

and

E {(R_{i j} - μ)}^{4} = E (R_{i j}^{4}) - 4 μ E (R_{i j}^{3}) + 6 μ^{2} E (R_{i j}^{2}) - 3 μ^{4} .

Note that the first four cumulants of a distribution are its mean, variance, third central moment, and fourth central moment minus three times the squared variance. We can also obtain the exact first four cumulants of the distribution of the residuals of independence. Corollary 1 gives explicit expressions for the third and fourth central moments as well as the fourth cumulant.

Corollary 1.

Under the conditions of Theorem 2, the third central moment of

R_{i j}

is

\begin{matrix} n_{+ +}^{3} E {(R_{i j} - μ)}^{3} = n_{+ +}^{3} E (R_{i j}^{3}) - 3 (n_{+ +} μ) [n_{+ +}^{2} E (R_{i j}^{2})] + 2 n_{+ +}^{3} μ^{3} \\ = 8 n_{+ +} (n_{+ +} - 1) (5 n_{+ +}^{2} - 17 n_{+ +} + 15) {(π_{i j} - π_{i +} π_{+ j})}^{3} \\ + 18 n_{+ +} (n_{+ +} - 1) {(n_{+ +} - 2)}^{2} {(π_{i j} - π_{i +} π_{+ j})}^{2} (π_{i +} + π_{+ j} - 2 π_{i j}) \\ - 6 n_{+ +} {(n_{+ +} - 1)}^{2} (2 n_{+ +} - 3) π_{i j} (π_{i j} - π_{i +} π_{+ j}) (1 - π_{i +} - π_{+ j} + π_{i j}) \\ + 6 n_{+ +} (n_{+ +} - 1) (n_{+ +}^{2} - 7 n_{+ +} + 9) (π_{i j} - π_{i +} π_{+ j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + n_{+ +} (n_{+ +} - 1) (n_{+ +} - 2) (n_{+ +} - 3) [π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) \\ + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} - {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) - (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3}] \\ + 3 n_{+ +} (n_{+ +} - 1) (n_{+ +} - 2) [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (1 - π_{i +} - π_{+ j} + 2 π_{i j}) \\ - (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) (π_{i +} + π_{+ j} - 2 π_{i j})] \\ + (π_{i j} - π_{i +} π_{+ j}) . \end{matrix}

The fourth central moment of

R_{i j}

is

\begin{matrix} n_{+ +}^{4} E {(R_{i j} - μ)}^{4} = n_{+ +}^{4} E (R_{i j}^{4}) - 4 (n_{+ +} μ) [n_{+ +}^{3} E (R_{i j}^{3}] + 6 n_{+ +}^{2} μ^{2} [n_{+ +}^{2} E (R_{i j}^{2})] - 3 μ^{4} \\ = 12 n_{+ +} (n_{+ +} - 1) (4 n_{+ +}^{4} - 72 n_{+ +}^{3} + 337 n_{+ +}^{2} - 629 n_{+ +} + 420) {(π_{i j} - π_{i +} π_{+ j})}^{4} \\ + 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (n_{+ +} - 2) (n_{+ +}^{2} - 13 n_{+ +} + 24) {(π_{i j} - π_{i +} π_{+ j})}^{3} (π_{i +} + π_{+ j} - 2 π_{i j}) \\ - 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{3} (n_{+ +}^{2} - 9 n_{+ +} + 12) π_{i j} {(π_{i j} - π_{i +} π_{+ j})}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) \\ - 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (n_{+ +} - 4) (5 n_{+ +} - 9) {(π_{i j} - π_{i +} π_{+ j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 4 n_{+ +} (n_{+ +} - 1) {(π_{i j} - π_{i +} π_{+ j})}^{2} \\ - 4 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (n_{+ +} - 2) (n_{+ +} - 3) (π_{i j} - π_{i +} π_{+ j}) [π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) \\ + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} - {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) - (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3}] \\ - 12 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (n_{+ +} - 2) (π_{i j} - π_{i +} π_{+ j}) [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) \\ \times (1 - π_{i +} - π_{+ j} + 2 π_{i j}) - (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) (π_{i +} + π_{+ j} - 2 π_{i j})] \\ + n_{+ +}^{(7)} [6 π_{i j}^{4} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} + 6 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ - 12 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 12 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ - 12 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{2} \\ - 12 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{3} \\ + 6 {(π_{i +} - π_{i j})}^{4} {(π_{+ j} - π_{i j})}^{3} + 6 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{4}] \\ + n_{+ +}^{(6)} [7 π_{i j}^{4} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} + 7 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ + 36 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - 4 π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 4 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 30 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ - 30 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ - 4 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) \\ - 4 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3} \\ + 7 {(π_{i +} - π_{i j})}^{4} {(π_{+ j} - π_{i j})}^{2} + 7 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{4} \\ + 36 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(5)} [π_{i j}^{4} (1 - π_{i +} - π_{+ j} + π_{i j}) + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ + 42 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} + 42 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 6 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ - 6 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + {(π_{i +} - π_{i j})}^{4} (π_{+ j} - π_{i j}) + (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{4} \\ + 42 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{2} + 42 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(4)} [6 π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) + 49 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} - 2 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) + 49 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ + 6 (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(3)} [7 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) + 7 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} \\ + 7 {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) + 7 (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2}] \\ + n_{+ +}^{(2)} [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})] \end{matrix}

The fourth cumulant of

R_{i j}

is

\begin{matrix} n_{+ +}^{4} κ_{4} (R_{i j}) = n_{+ +}^{4} E {(R_{i j} - μ)}^{4} - 3 {[n_{+ +}^{2} V a r (R_{i j})]}^{2} \\ = - 48 n_{+ +} (n_{+ +} - 1) (14 n_{+ +}^{3} - 79 n_{+ +}^{2} + 155 n_{+ +} - 105) {(π_{i j} - π_{i +} π_{+ j})}^{4} \\ + 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} {(n_{+ +} - 2)}^{2} (n_{+ +} - 15) {(π_{i j} - π_{i +} π_{+ j})}^{3} (π_{i +} + π_{+ j} - 2 π_{i j}) \\ - 3 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} {(n_{+ +} - 2)}^{2} {(π_{i j} - π_{i +} π_{+ j})}^{2} {(π_{i +} + π_{+ j} - 2 π_{i j})}^{2} \\ - 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{3} (n_{+ +}^{2} - 13 n_{+ +} + 18) π_{i j} {(π_{i j} - π_{i +} π_{+ j})}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) \\ - 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (5 n_{+ +}^{2} - 33 n_{+ +} + 42) {(π_{i j} - π_{i +} π_{+ j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 4 n_{+ +} (n_{+ +} - 1) {(π_{i j} - π_{i +} π_{+ j})}^{2} \\ - 4 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (n_{+ +} - 2) (n_{+ +} - 3) (π_{i j} - π_{i +} π_{+ j}) [π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) \\ + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) - (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3}] \\ - 12 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (n_{+ +} - 2) (π_{i j} - π_{i +} π_{+ j}) [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) \\ \times (1 - π_{i +} - π_{+ j} + 2 π_{i j}) - (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) (π_{i +} + π_{+ j} - 2 π_{i j})] \\ + 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{3} (n_{+ +} - 2) π_{i j} (π_{i j} - π_{i +} π_{+ j}) (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} + π_{+ j} - 2 π_{i j}) \\ + 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} (n_{+ +} - 2) (π_{i j} - π_{i +} π_{+ j}) (π_{i +} + π_{+ j} - 2 π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 3 n_{+ +}^{2} {(n_{+ +} - 1)}^{4} π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} - 3 n_{+ +}^{2} {(n_{+ +} - 1)}^{2} {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ - 6 n_{+ +}^{2} {(n_{+ +} - 1)}^{3} π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + n_{+ +}^{(7)} [6 π_{i j}^{4} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} + 6 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ - 12 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 12 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ - 12 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{2} \\ - 12 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{3} \\ + 6 {(π_{i +} - π_{i j})}^{4} {(π_{+ j} - π_{i j})}^{3} + 6 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{4}] \\ + n_{+ +}^{(6)} [7 π_{i j}^{4} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} + 7 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ + 36 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - 4 π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 4 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 30 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ - 30 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} \\ - 4 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) \\ - 4 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3} \\ + 7 {(π_{i +} - π_{i j})}^{4} {(π_{+ j} - π_{i j})}^{2} + 7 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{4} \\ + 36 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(5)} [π_{i j}^{4} (1 - π_{i +} - π_{+ j} + π_{i j}) + π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{4} \\ + 42 π_{i j}^{3} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} + 42 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} \\ - 6 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ - 6 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) \\ - 6 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2} \\ + {(π_{i +} - π_{i j})}^{4} (π_{+ j} - π_{i j}) + (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{4} \\ + 42 {(π_{i +} - π_{i j})}^{3} {(π_{+ j} - π_{i j})}^{2} + 42 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(4)} [6 π_{i j}^{3} (1 - π_{i +} - π_{+ j} + π_{i j}) + 49 π_{i j}^{2} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} \\ + 6 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{3} - 2 π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) (π_{i +} - π_{i j}) (π_{+ j} - π_{i j}) \\ + 6 {(π_{i +} - π_{i j})}^{3} (π_{+ j} - π_{i j}) + 49 {(π_{i +} - π_{i j})}^{2} {(π_{+ j} - π_{i j})}^{2} + 6 (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{3}] \\ + n_{+ +}^{(3)} [7 π_{i j}^{2} (1 - π_{i +} - π_{+ j} + π_{i j}) + 7 π_{i j} {(1 - π_{i +} - π_{+ j} + π_{i j})}^{2} \\ + 7 {(π_{i +} - π_{i j})}^{2} (π_{+ j} - π_{i j}) + 7 (π_{i +} - π_{i j}) {(π_{+ j} - π_{i j})}^{2}] \\ + n_{+ +}^{(2)} [π_{i j} (1 - π_{i +} - π_{+ j} + π_{i j}) + (π_{i +} - π_{i j}) (π_{+ j} - π_{i j})] \end{matrix}

where

μ = E (R_{i j}) = (n_{+ +} - 1) (π_{i j} - π_{i +} π_{+ j})

and

n_{+ +}^{(m)} = n_{+ +} (n_{+ +} - 1) \dots (n_{+ +} - m + 1)

for any nonnegative integer

m .

3. Conclusions

We have explicitly derived the first four moments of the residuals of independence in a two-way contingency table under a multinomial model. From these exact moments, we have the exact skewness,

E {(R_{i j} - μ)}^{3} / σ^{3},

and kurtosis,

E {(R_{i j} - μ)}^{4} / σ^{4},

of the distribution of the residuals of independence. These explicit but tedious results provide us with the vital statistical characteristics of the exact distribution of the residuals of independence in the association analysis of two-way contingency tables. Moreover, since the joint probability distribution of independent Poisson random variables, depending on their sum, is a multinomial distribution, these exact results can also be used in the residual analysis of log-linear models. Higher-order raw moments of the residuals of independence can be found similarly, but the results are more complicated.

Currently, most residual diagnostics of discrete data depend on large-sample methods. When sample sizes are not large or data are sparse, diagnostic results based on large-sample theory are debatable, and exact methods or methods based on non-asymptotic theory are desirable. The explicit moments of the residuals of independence contribute to exact residual diagnostics significantly. More discussions of and references to the exact analysis of discrete data are given in [5].

Funding

This research received no external funding.

Data Availability Statement

The original contributions presented in this study are included in the article. Further inquiries can be directed to the corresponding author.

Acknowledgments

The author appreciates the insightful comments and suggestions from the editors and referees that substantially improved the presentation of the article.

Conflicts of Interest

The author declares no conflicts of interest.

References

Smithers, L.G.; Lynch, J.W.; Yang, S.; Dahhou, M.; Kramer, M.S. Impact of Neonatal Growth on IQ and Behavior at Early School Age. Pediatrics 2013, 132, 53–60. [Google Scholar]
Mosimann, J.E. On the Compound Multinomial Distribution, the Multivariate β-Distribution, and Correlations among Proportions. Biometrics 1962, 49, 61–82. [Google Scholar]
Johnson, N.L.; Kotz, S.; Balakrishnan, N. Discrete Multivariate Distributions; John Wiley & Sons Inc.: Hoboken, NJ, USA, 1997. [Google Scholar]
Agresti, A. Categorical Data Analysis, 3rd ed.; John Wiley & Sons Inc.: Hoboken, NJ, USA, 2013. [Google Scholar]
Hirji, K.F. Exact Analysis of Discrete Data; Chapman & Hall/CRC: Boca Raton, FL, USA, 2006. [Google Scholar]

Table 1. Paternal education and neonatal weight gain.

	$Q_{1}$	$Q_{2}$	$Q_{3}$	$Q_{4}$	Total
Complete university	422	433	429	414	1698
	(411.63)	(444.79)	(422.64)	(418.93)
Partially complete university	1493	1655	1556	1605	6309
	(1529.44)	(1652.65)	(1570.35)	(1556.56)
Complete secondary education	1239	1276	1243	1179	4937
	(1196.84)	(1293.25)	(1228.85)	(1218.06)
Incomplete secondary education	61	110	73	74	318
	(77.09)	(83.30)	(79.15)	(78.46)
Total	3215	3474	3301	3272	13,262

Disclaimer/Publisher’s Note: The statements, opinions and data contained in all publications are solely those of the individual author(s) and contributor(s) and not of MDPI and/or the editor(s). MDPI and/or the editor(s) disclaim responsibility for any injury to people or property resulting from any ideas, methods, instructions or products referred to in the content.

© 2024 by the author. Licensee MDPI, Basel, Switzerland. This article is an open access article distributed under the terms and conditions of the Creative Commons Attribution (CC BY) license (https://creativecommons.org/licenses/by/4.0/).

Share and Cite

MDPI and ACS Style

Qu, X. Exact Moments of Residuals of Independence. Mathematics 2024, 12, 3987. https://doi.org/10.3390/math12243987

AMA Style

Qu X. Exact Moments of Residuals of Independence. Mathematics. 2024; 12(24):3987. https://doi.org/10.3390/math12243987

Chicago/Turabian Style

Qu, Xianggui. 2024. "Exact Moments of Residuals of Independence" Mathematics 12, no. 24: 3987. https://doi.org/10.3390/math12243987

APA Style

Qu, X. (2024). Exact Moments of Residuals of Independence. Mathematics, 12(24), 3987. https://doi.org/10.3390/math12243987

Note that from the first issue of 2016, this journal uses article numbers instead of page numbers. See further details here.

Article Menu

Exact Moments of Residuals of Independence

Abstract

1. Introduction

2. Main Results

3. Conclusions

Funding

Data Availability Statement

Acknowledgments

Conflicts of Interest

References

Share and Cite

Article Metrics

Article Access Statistics

Further Information

Guidelines

MDPI Initiatives

Follow MDPI