통계 결과가 실렸거나 어떤 것의 중요성을 논하는 과학 논문에서 사용된 ‘significant’라는 단어를 몇 번이나 보셨나요? 통계적 의미인지 비통계적 의미인지에 따라 뜻이 다르다는 사실도 알고 계셨나요?
예를 들어, 어느 논문의 논의 부분에 있는 이런 문장이 있다면 어디가 잘못되었을까요?
Significant levels of bisphenol-A were detected in 47 of the 50 sites sampled (85.0%).
‘significant’는 일반적인 의미로 정도나 범위를 표현할 때 쓴다는 것은 분명합니다. 그러나 여기서 저자가 수준의 중요성이나 관련성을 표현하고 있는 것인지, 아니면 통계적 혹은 정량적 해석을 표현하고 있는 것인지는 분명하지가 않습니다.
이 영작 팁을 이해하기 쉽고 일반적인 예문들과 구별하기 쉽도록 ‘significant’를 두 가지 범주, 즉 ‘통계적’ 용법과 ‘비통계적’ 용법으로 나누었습니다.
통계적 용법
통계적 의미로 ‘significant’는 주로 결과 부분에서 귀무가설 또는 보통 P<0.05인 P값을 바탕으로 한 기선 측정과 변수가 얼마나 다른지를 표현할 때 사용합니다.
There was a statistically significant difference between the experiment and control groups (P<0.05), leading us to reject our null hypothesis.
(실험과 제어 집단 간에 통계적으로 유의미한 차이가 있어(P < 0.05) 우리의 귀무가설을 거부하게 되었다.)
이것은 두 집단을 비교하는 분석의 통계적 기준을 만족시킬 정도로 두 집단 간의 양적 차이가 충분히 컸다는 뜻입니다.
참고로, 부사인 ‘significantly’와 형용사를 결합해서 사용하면 더 효과적이고 자연스러울 때가 많은데, 그렇게 하면 무엇을 측정한 것인지를 독자가 쉽게 이해할 수 있기 때문입니다.
그저그런 예: There was a statistically significant difference between the time taken by our nutrient extraction method to extract 1 kg of oleic acid and that taken by the leading conventional method (Robinson et al., 2015) (6.3±1.2 h vs. 8.0±0.5 h; p=0.032).
(우리의 영양소 추출법으로 올레산 1kg을 추출하는데 걸린 시간과 기존의 주요 방식을 사용할 때 걸린 시간 간에 통계적으로 유의미한 차이가 있었다(로빈슨 외, 2015) (6.3 ±1.2 h vs. 8.0 ±0.5 h; p=0.032).)
더 나은 예: Our nutrient extraction method extracted 1 kg of oleic acid significantly faster than the leading conventional method (Robinson et al., 2015) (6.3±1.2 h vs. 8.0±0.5 h; p=0.032).
(우리의 영양소 추출법을 사용했을 때 기존의 주요 방식을 사용한 것보다 올레산 1kg을 유의미하게 더 빨리 추출할 수 있었다(로빈슨 외, 2015) (6.3 ±1.2 h vs. 8.0 ±0.5 h; p=0.032).)
비통계적 용법
비통계적인 의미로 ‘significant’는 어떤 것의 중요성이나 관련성을 나타낼 때 주로 사용합니다.
Iron ore is a significant export contributing to Australia’s economy. (철광석은 호주 경제에 기여하는 의미있는 수출품이다.)
이렇게 바꿔쓸 수 있습니다. Iron is an important export contributing to Australia’s economy.
Our finding that rice paddy runoff reduces salinity of adjacent lagoons bears significance on India’s aquacultural policy. (논에서 흘러나온 물이 인근 석호의 염분을 줄인다는 연구 결과는 인도의 수경재배 정책에 의미가 있다.)
이렇게 바꿔쓸 수 있습니다. Our finding that rice paddy runoff reduces the salinity of adjacent lagoons has relevance to India’s aquacultural policy.
여기서는 일반적인 의미입니다. 예를 들어, 첫 번째 문장은 호주의 모든 수출품이 분석되었다는 의미는 아니고, 통계 결과를 통해 철의 양이 다른 수출품보다 많다는 것을 분명히 알 수 있습니다. 이 문장은 단지 호주가 철을 많이 수출한다는 뜻입니다(호주는 밀과 양모도 많이 수출하는데 그것은 여기서 의미가 없습니다).
모호성 해결 - 예시 1
Significant levels of bisphenol-A were detected in 47 of the 50 sites sampled (85.0%).
저자가 표준 또는 기준치 측정에 비해 수준이 상당히 높았다고 말하고 있습니까? 아니면 이러한 결과가 중요했다고(따라서 우려할 만하다고) 말하고 있습니까? 두 가지를 다 의도했다고 해도 이 문장은 많이 수정해야 합니다.
1) 문법만 가지고 보면 독자는 비스페놀 A가 좋은 것이고 그 수준이 '낮으면' 우려해야 한다고 추정하는 것이 당연합니다.
2) 비교 대상이 없습니다. 수준이 무엇보다 높은(또는 낮은) 것입니까?
중요하다는 뜻: The high levels of bisphenol-A detected in 47 of the 50 sites samples (85.0%) are cause for concern.
(표본 50곳 중 47곳에서 검출된 비스페놀 A의 높은 수준(85.0%)은 우려할 만하다.)
통계적으로 유의미하다는 뜻: Levels of bisphenol-A significantly higher (p<0.001) than the amount EPA guidelines consider safe were detected in 47 of the 50 sites sampled (85.0%).
(EPA 지침이 안전하다고 여기는 양보다 유의미하게 높은 비스페놀 A의 수준(p < 0.001)이 표본 50곳 중 47곳에서 검출되었다(85.0%).)
모호성 해결 - 예시 2
Our results agree with the significant findings of Kang et al. (2006), who found that β-carotene production was more efficient in 5% kerosene-supplemented media than in non-supplemented media.
(우리의 결과는 비보충 매체보다 5% 등유 보충 매체에서 베타카로틴 생산이 더 효율적이었다는 사실을 알아낸 강 외(2006)의 의미 있는 연구 결과와 일치한다.)
강 외의 연구 결과가 통계적으로 유의미하다는 것입니까? ‘5% 등유 보충 매체’와 ‘비보충 매체’를 분명히 비교한 것을 보면 확실히 그렇게 암시되어 있습니다. 아니면 저자가 강 외의 연구 결과가 중요하고 획기적이었다고 말하는 걸까요? 문법을 보면 그런 해석을 할 수 있습니다.
저자는 둘 다를 의미하는 것일 수도 있습니다! 만약 강 외의 연구 결과가 통계적으로 유의미하기도 하면서 획기적이기도 하다면 이렇게 써도 괜찮습니다. 그러나 그런 것이 아니라면(예를 들어 강 외의 연구 결과가 특별히 새롭지 않다면) 단어의 두 가지 용법 중 하나로 제한해서 써야 합니다.
중요하다는 뜻: Our results agree with the major findings of Kang et al. (2006), who found that β-carotene production was more efficient in 5% kerosene-supplemented media than in non-supplemented media.
(우리의 결과는 비보충 매체보다 5% 등유 보충 매체에서 베타카로틴 생산이 더 효율적이었다는 사실을 알아낸 강 외(2006)의 중요한 연구 결과와 일치한다.)
통계적으로 유의미하다는 뜻: Our results agree with the findings of Kang et al. (2006), who found that β-carotene production was significantly more efficient in 5% kerosene-supplemented media than in non-supplemented media (F4,15 = 25.6, P < 0.001).
(우리의 결과는 비보충 매체보다 5% 등유 보충 매체에서 베타카로틴 생산이 유의미하게 더 효율적이었다는 사실을 알아낸 강 외(2006)의 연구 결과와 일치한다(F4,15 = 25.6, P < 0.001).)
위 예시의 핵심은 다음과 같습니다.
1) Significance(혹은 significant, significantly)라는 단어는 양을 측정하거나 중요도와 관련성을 표현할 때 사용됩니다.
2) 사용법을 ‘통계적’ 의미와 ‘비통계적’ 의미로 간편하게 분류할 수 있습니다.
Uni-edit English Writing Tip 011: How to significantly improve your usage of the term ‘significant’
Difficulty: Intermediate
How many times have you seen the word ‘significant’ used in a scientific paper either with statistical results or to discuss the importance of something? Did you know its meaning is different depending on if it is used in a statistical or non-statistical sense?
For example, what’s wrong with this sentence from a paper’s Discussion section?
Significant levels of bisphenol-A were detected in 47 of the 50 sites sampled (85.0%).
What is clear is that ‘significant’ is used in a general sense, to indicate degree or extent. What is unclear is whether the author is referring to the levels’ importance or relevance, or instead to a statistical, quantitative interpretation.
To make this writing tip easy to follow and distinguish common examples, we divide ‘significant’ into two categories: ‘statistical’ and ‘non-statistical’.
Statistical Usage
In its statistical sense, ‘significant’ is commonly used in the Results section to indicate how much a variable differs from a null hypothesis or baseline measurement based on the P-value, usually P<0.05.
There was a statistically significant difference between the experiment and control groups (P<0.05), leading us to reject our null hypothesis.
This means the quantitative difference between the two groups was large enough to satisfy the statistical criteria of the analysis comparing the two groups.
By the way, it is often more effective and natural to combine the adverb form ‘significantly’ with an adjective, so that readers intuitively understand the axis of measurement.
Okay: There was a statistically significant difference between the time taken by our nutrient extraction method to extract 1 kg of oleic acid and that taken by the leading conventional method (Robinson et al., 2015) (6.3±1.2 h vs. 8.0±0.5 h; p=0.032).
Better: Our nutrient extraction method extracted 1 kg of oleic acid significantly faster than the leading conventional method (Robinson et al., 2015) (6.3±1.2 h vs. 8.0±0.5 h; p=0.032).
Non-statistical Usage
In its non-statistical sense, ‘significant’ is commonly used to express the importance or relevance of something, generally speaking.
Iron ore is a significant export contributing to Australia’s economy.
This could be rephrased to: Iron is an important export contributing to Australia’s economy.
Our finding that rice paddy runoff reduces salinity of adjacent lagoons bears significance on India’s aquacultural policy.
This could be rephrased to: Our finding that rice paddy runoff reduces the salinity of adjacent lagoons has relevance to India’s aquacultural policy.
The meanings here are general. For example, the first sentence does not mean that all of Australia’s exports were analyzed, and our statistical results give us confidence that the quantity of iron was greater than another export. It just means Australia exports a lot of iron (it also exports a lot of wheat and wool, but that’s not relevant here).
Resolving ambiguity - Example 1
Significant levels of bisphenol-A were detected in 47 of the 50 sites sampled (85.0%).
Does the author mean that the levels were significantly higher with respect to a standard or baseline measurement? Or that these results were important (and thus cause for concern)? This sentence requires major revision, even if both usages were intended:
1.) Based on the grammar alone, a reader is justified in assuming bisphenol-A is good, and that low levels are cause for concern.
2.) There is no object of comparison: what are the levels higher (or lower) than?
Important: The high levels of bisphenol-A detected in 47 of the 50 sites samples (85.0%) are cause for concern.
Statistically significant: Levels of bisphenol-A significantly higher (p<0.001) than the amount EPA guidelines consider safe were detected in 47 of the 50 sites sampled (85.0%).
Resolving ambiguity - Example 2
Our results agree with the significant findings of Kang et al. (2006), who found that β-carotene production was more efficient in 5% kerosene-supplemented media than in non-supplemented media.
Does the author mean that the Kang et al.’s findings were statistically significant? This is certainly suggested by the explicit comparison of ‘5% kerosene-supplemented media’ and ‘non-supplemented media’. Or does the author mean Kang et al.’s findings were important and ground-breaking? The grammar suggests this interpretation.
The author likely means both! If Kang et al.’s findings were both statistically significant and ground-breaking, this usage is acceptable. However, we can limit the word to one of these usages if warranted (e.g., if Kang et al.’s findings were not particularly novel).
Important: Our results agree with the major findings of Kang et al. (2006), who found that β-carotene production was more efficient in 5% kerosene-supplemented media than in non-supplemented media.
Statistically significant: Our results agree with the findings of Kang et al. (2006), who found that β-carotene production was significantly more efficient in 5% kerosene-supplemented media than in non-supplemented media (F4,15 = 25.6, P < 0.001).
The take-home messages from the above examples are:
1.) Significance is used to measure quantity, importance, and relevance; and
2.) Its usages can be conveniently categorized as ‘statistical’ and ‘non-statistical’.