ESG 평가에서 같은 기업을 놓고도 평가 기관마다 다른 평가점수, 다른 등급을 부여한 사례가 자주 입에 오르내린다.
각 평가 기관이 고유한 평가 체계를 개발해 사용하는 만큼 평가 결과에 약간의 차이는 발생할 수밖에 없지만, 때로는 차이가 너무 커 일정 수준의 통일성은 필요하다는 지적도 나온다.
기관마다 내놓는 평가 등급에서 차이가 벌어지면 ESG 평가 자체에 대한 신뢰도가 떨어질 수밖에 없다. 투자자로서도 해당 기업에 대한 투자 여부를 판단하는 데 어려움을 겪게 된다.
평가 등급 차이는 왜 생기는 것일까. 차이를 줄일 방법은 없는 것일까.
스웨덴의 스톡홀름 경제대학 연구팀은 최근 나스닥(Nasdaq) 홈페이지를 통해 공개된 논문에서 이 문제를 다뤘다. 스웨덴 연구팀은 “관련 논문 12편을 분석한 결과, 다양한 평가 기관에서 동일 기업에 대해 내놓은 ESG 등급 사이에 상관관계가 대체로 낮았다”고 밝혔다.
턱 없이 낮은 등급 상관관계
12개 논문 가운데 한 논문에서는 6개 평가 기관에서 수집한 데이터에 분석했는데, 각 평가 기관이 내놓은 등급의 상관관계(상관계수)는 평균 0.54였고, 가장 낮은 경우는 0.38에 그쳤다.
스위스 제네바 대학 연구팀이 2021년 ‘재무 분석가 저널(Financial Analysts Journal)’에 발표한 논문에서는 7개 평가 기관의 등급 불일치 문제를 다뤘는데, 등급 상관관계가 평균 0.45에 불과했다. 스위스 연구팀은 평가 등급 차이는 주로 환경적 측면(E)에 대한 의견 차이로 인해 발생한다고 지적했다.
또 다른 논문에서는 A, B, C 세 기관의 평가 등급을 비교했다. A-B, B-C, C-A 등으로 짝을 지어 상관관계를 구한 결과, 각각 0.65, 0.65, 0.72인 것으로 상관관계가 높은 편은 아니었다.
유럽 기업만을 대상으로 평가했을 때도 등급의 상관관계가 0.58 수준으로 기록됐다고 보고한 논문도 있었다.
기업 평가와는 달리 국가 ESG 평가에서는 상관관계가 0.72~0.95로 높게 나타났다. 국가에서 제시하는 데이터는 기업에 비해 훨씬 표준화된 형태로 돼 있어 평가 결과도 일치하는 경향이 있다.
평가 등급이 전체적으로 일치하지 않더라도, 가장 낮은 순위의 회사들에 대해서는 평가가 일치하는 경향을 보였다. 최악의 ESG 성과를 보인 10% 기업에 대해서는 0.95의 높은 상관관계가 나타냈다. 반대로 수익성이 높은 기업들도 ESG 등급이 일치하는 경향이 있다.
하지만 다른 연구자는 ESG 등급과 등급 평가의 일치성 사이에 U자형 관계가 있다고 주장한다. 가장 낮은 ESG 등급을 나타내는 기업에 대해 불일치가 가장 높았고, 다음으로 ESG 등급이 가장 높은 기업도 불일치가 높았다. 순위 분포의 중간에 있는 기업은 불일치 수준이 가장 낮았다는 것이다.
차이는 평가 범주와 지표 탓
평가 기관마다 등급이 다르게 나오는 데 대해 연구팀은 논문에서 평가 범주, 측정 지표, 지표 가중치 탓이라고 설명했다.
평가 범주와 관련해 A라는 평가 기관에서는 ‘이사회의 다양성’이란 범주가 포함될 수도 있지만, B라는 평가 기관에서는 이를 제외할 수도 있다. 이로 인해 평가가 달라질 수 있다.
측정 지표 문제는 동일한 범주를 평가할 때도 서로 다른 지표를 참조할 수 있다는 점을 말한다. ‘이사회의 다양성’을 측정하기 위해 한 평가 기관에서는 성별 다양성을 지표로 사용하는 반면 다른 기관에서는 중간 연령을 지표로 사용할 수도 있다. 정책(기업의 신념, 원칙, 의지)에 중점을 두는 지표를 선택할 것인지, 아니면 결과(성과)에 중점을 두는 지표를 선택할 것인지에 따라 평가 결과는 달라질 수 있다.
평가 기관별로 사용하는 지표의 숫자에서도 차이가 있다. 어떤 기관은 37개의 ESG 지표를, 어떤 기관은 300개를 사용한다. 4개의 ESG 시장 지수(STOXX, Dow Jones, Refinitiv, MSCI)를 비교한 결과, 이들이 사용하는 지표의 일치도는 35~59% 범위였다. 4가지 지수 모두 공통으로 사용한 지표는 전체의 15%에 불과했다.
지표별 가중치도 영향을 준다. 각 지표에 할당하는 상대적 중요성이 가중치인데, 이는 평가 기관마다 다를 수 있다. 평가 기관들은 이 가중치를 구체적으로 밝히지 않는 경우가 많다.
평가 등급 불일치를 유발하는 또 다른 요인으로는 '평가자 효과'도 있다. 한 범주에서 높은 점수를 받은 회사는 동일한 평가자에 의해 다른 모든 범주에서도 높은 점수를 받을 가능성이 더 높다. 평가자가 특별히 중요시하는 지표가 따로 있을 수도 있고, 선입견이 작용할 수도 있다는 얘기다.
이와 함께 평가 기관의 지리적 위치도 영향을 준다. 미국에 본사를 둔 평가 기관인 KLD는 유럽 기관인 Asset4보다 사회 문제에 더 큰 비중을 두고 있다는 지적이 있다. 평가 기관의 사회적, 맥락적 기원이 지속가능성에 대한 개념에 영향을 주고, 궁극적으로 ESG 측정과 평가에 큰 영향을 미친다는 것이다. 평가 기관의 동기, 문화유산, 국가적 맥락 등에 따라 평가 결과가 달라질 수 있는 셈이다.
거버넌스 항목에서 큰 차이
평가 기관마다 평가 결과가 다르지만, 자세히 들여다보면 등급 차이가 모든 항목에서 균등하게 나타나지는 않는다. 일부 연구에서는 거버넌스(G) 범주에 대한 평가 결과가 환경(E), 사회(S) 범주보다 더 큰 차이를 유발한다고 지적한다.
실제로 한 연구에서 G 범주의 평가 등급에 대한 상관관계는 평균 0.33인 반면, S 범주는 평균 0.42, E 범주는 0.53이었다. 다른 연구에서도 G 범주의 상관관계는 0.19에 불과한 반면 환경 상관관계는 0.43으로 상대적으로 높았다.
물론 G 범주보다 E나 S 범주의 상관관계가 더 낮았다는 연구 결과도 없지는 않다.
평가 대상 기업의 업종도 평가 등급 차이가 벌어지게 만든다. 에너지 부문은 상관관계가 0.55로 낮고, 기술이나 서비스, 금융 등은 0.74~0.77로 높은 편이다.
내구 소비재 및 통신 산업의 경우 E와 S 범주에서, 금융 서비스 회사의 경우 G 범주에서 가장 높은 등급 불일치를 기록했다.
대기업, 신용 등급이 없는 기업, ESG 공개가 더 나은 기업, 분석가가 더 많은 기업의 경우 불일치가 더 높다는 사실도 확인됐다. 더 많은 자료를 공개한다고 해서 등급 판정이 반드시 일치하지는 않는다는 것은 평가에 그만큼 주관적인 판단이 개입한다는 의미다. 공개 정보가 많을수록 평가자들이 주관적으로 판단하는, 객관적으로 점수를 매기기 어려운 정보도 그만큼 많아진다.
평가 등급의 불일치에도 불구하고 전체적으로는 기업의 ESG 공개가 높을수록 ESG 점수가 높아지는 경향이 있었다. 이는 현재 ESG 점수 측정이 더 많은 자원을 갖춘 대규모 회사를 선호한다는 것을 의미하기도 한다.
어느 정도 차이는 인정해야
평가 기관마다 서로 다른 결과를 내놓는다는 것은 평가 체계의 다양성이나 평가 기관의 특성에 비추어 자연스러운 결과라고 논문은 설명했다. 기업의 E, S, G 항목에 대해 일정 정도 주관적인 결론을 내릴 수밖에 없다는 것이다.
문제는 등급 불일치가 가져오는 모호성이 기업의 ESG 노력 자체를 저해할 수도 있다는 점이다. ESG 노력이 기업 주식이나 채권 가격에 정확히 반영되지 않는다면 기업으로서는 ESG 경영에 힘을 쏟을 필요를 못 느끼게 된다.
투자자도 등급 불일치가 나타나면 자신의 투자에서 명확한 근거를 찾지 못하게 된다. 명확한 근거가 없으면 많은 돈을 장기간 투자하기 어렵다.
이 때문에 ESG 평가에 사용되는 데이터를 표준화하고, 이를 바탕으로 평가 과정을 객관화, 과학화하자는 주장이 나온다. 평가 기관에 데이터 수집부터 평가 절차 등에 투명한 공개를 요구하기도 한다.
일부에서는 신용 등급 평가가 자리를 잡은 것처럼 장기적으로 ESG 평가도 표준화된 데이터 개발을 통해 일정한 방법론에 수렴할 것으로 전망한다. 또, 평가 기관의 인수합병을 통해 다양한 평가 방법이 몇 가지로 줄어들 것으로 기대한다.
일부에서는 반론도 있다. ESG 평가가 기존 재무 분석과는 달라야 한다는 점을 강조하는 목소리다. ESG 평가는 자연환경 보전 노력 등 기업의 비재무적 가치를 따지는 것인데, ESG 평가마저 금융 가치라는 잣대에 맞춰 진행하는 것이 과연 옳은 방향이냐 하고 우려한다.
결국, 당분간은 평가 등급 불일치를 놓고 논란은 계속될 수밖에 없다. 투자자로서는 여러 기관에서 나은 ESG 등급을 동시에 참고해야 하는 상황이다.
강찬수 환경신데믹연구소장
ESG 평가에서 같은 기업을 놓고도 평가 기관마다 다른 평가점수, 다른 등급을 부여한 사례가 자주 입에 오르내린다.
각 평가 기관이 고유한 평가 체계를 개발해 사용하는 만큼 평가 결과에 약간의 차이는 발생할 수밖에 없지만, 때로는 차이가 너무 커 일정 수준의 통일성은 필요하다는 지적도 나온다.
기관마다 내놓는 평가 등급에서 차이가 벌어지면 ESG 평가 자체에 대한 신뢰도가 떨어질 수밖에 없다. 투자자로서도 해당 기업에 대한 투자 여부를 판단하는 데 어려움을 겪게 된다.
평가 등급 차이는 왜 생기는 것일까. 차이를 줄일 방법은 없는 것일까.
스웨덴의 스톡홀름 경제대학 연구팀은 최근 나스닥(Nasdaq) 홈페이지를 통해 공개된 논문에서 이 문제를 다뤘다. 스웨덴 연구팀은 “관련 논문 12편을 분석한 결과, 다양한 평가 기관에서 동일 기업에 대해 내놓은 ESG 등급 사이에 상관관계가 대체로 낮았다”고 밝혔다.
턱 없이 낮은 등급 상관관계
12개 논문 가운데 한 논문에서는 6개 평가 기관에서 수집한 데이터에 분석했는데, 각 평가 기관이 내놓은 등급의 상관관계(상관계수)는 평균 0.54였고, 가장 낮은 경우는 0.38에 그쳤다.
스위스 제네바 대학 연구팀이 2021년 ‘재무 분석가 저널(Financial Analysts Journal)’에 발표한 논문에서는 7개 평가 기관의 등급 불일치 문제를 다뤘는데, 등급 상관관계가 평균 0.45에 불과했다. 스위스 연구팀은 평가 등급 차이는 주로 환경적 측면(E)에 대한 의견 차이로 인해 발생한다고 지적했다.
또 다른 논문에서는 A, B, C 세 기관의 평가 등급을 비교했다. A-B, B-C, C-A 등으로 짝을 지어 상관관계를 구한 결과, 각각 0.65, 0.65, 0.72인 것으로 상관관계가 높은 편은 아니었다.
유럽 기업만을 대상으로 평가했을 때도 등급의 상관관계가 0.58 수준으로 기록됐다고 보고한 논문도 있었다.
기업 평가와는 달리 국가 ESG 평가에서는 상관관계가 0.72~0.95로 높게 나타났다. 국가에서 제시하는 데이터는 기업에 비해 훨씬 표준화된 형태로 돼 있어 평가 결과도 일치하는 경향이 있다.
평가 등급이 전체적으로 일치하지 않더라도, 가장 낮은 순위의 회사들에 대해서는 평가가 일치하는 경향을 보였다. 최악의 ESG 성과를 보인 10% 기업에 대해서는 0.95의 높은 상관관계가 나타냈다. 반대로 수익성이 높은 기업들도 ESG 등급이 일치하는 경향이 있다.
하지만 다른 연구자는 ESG 등급과 등급 평가의 일치성 사이에 U자형 관계가 있다고 주장한다. 가장 낮은 ESG 등급을 나타내는 기업에 대해 불일치가 가장 높았고, 다음으로 ESG 등급이 가장 높은 기업도 불일치가 높았다. 순위 분포의 중간에 있는 기업은 불일치 수준이 가장 낮았다는 것이다.
차이는 평가 범주와 지표 탓
평가 기관마다 등급이 다르게 나오는 데 대해 연구팀은 논문에서 평가 범주, 측정 지표, 지표 가중치 탓이라고 설명했다.
평가 범주와 관련해 A라는 평가 기관에서는 ‘이사회의 다양성’이란 범주가 포함될 수도 있지만, B라는 평가 기관에서는 이를 제외할 수도 있다. 이로 인해 평가가 달라질 수 있다.
측정 지표 문제는 동일한 범주를 평가할 때도 서로 다른 지표를 참조할 수 있다는 점을 말한다. ‘이사회의 다양성’을 측정하기 위해 한 평가 기관에서는 성별 다양성을 지표로 사용하는 반면 다른 기관에서는 중간 연령을 지표로 사용할 수도 있다. 정책(기업의 신념, 원칙, 의지)에 중점을 두는 지표를 선택할 것인지, 아니면 결과(성과)에 중점을 두는 지표를 선택할 것인지에 따라 평가 결과는 달라질 수 있다.
평가 기관별로 사용하는 지표의 숫자에서도 차이가 있다. 어떤 기관은 37개의 ESG 지표를, 어떤 기관은 300개를 사용한다. 4개의 ESG 시장 지수(STOXX, Dow Jones, Refinitiv, MSCI)를 비교한 결과, 이들이 사용하는 지표의 일치도는 35~59% 범위였다. 4가지 지수 모두 공통으로 사용한 지표는 전체의 15%에 불과했다.
지표별 가중치도 영향을 준다. 각 지표에 할당하는 상대적 중요성이 가중치인데, 이는 평가 기관마다 다를 수 있다. 평가 기관들은 이 가중치를 구체적으로 밝히지 않는 경우가 많다.
평가 등급 불일치를 유발하는 또 다른 요인으로는 '평가자 효과'도 있다. 한 범주에서 높은 점수를 받은 회사는 동일한 평가자에 의해 다른 모든 범주에서도 높은 점수를 받을 가능성이 더 높다. 평가자가 특별히 중요시하는 지표가 따로 있을 수도 있고, 선입견이 작용할 수도 있다는 얘기다.
이와 함께 평가 기관의 지리적 위치도 영향을 준다. 미국에 본사를 둔 평가 기관인 KLD는 유럽 기관인 Asset4보다 사회 문제에 더 큰 비중을 두고 있다는 지적이 있다. 평가 기관의 사회적, 맥락적 기원이 지속가능성에 대한 개념에 영향을 주고, 궁극적으로 ESG 측정과 평가에 큰 영향을 미친다는 것이다. 평가 기관의 동기, 문화유산, 국가적 맥락 등에 따라 평가 결과가 달라질 수 있는 셈이다.
거버넌스 항목에서 큰 차이
평가 기관마다 평가 결과가 다르지만, 자세히 들여다보면 등급 차이가 모든 항목에서 균등하게 나타나지는 않는다. 일부 연구에서는 거버넌스(G) 범주에 대한 평가 결과가 환경(E), 사회(S) 범주보다 더 큰 차이를 유발한다고 지적한다.
실제로 한 연구에서 G 범주의 평가 등급에 대한 상관관계는 평균 0.33인 반면, S 범주는 평균 0.42, E 범주는 0.53이었다. 다른 연구에서도 G 범주의 상관관계는 0.19에 불과한 반면 환경 상관관계는 0.43으로 상대적으로 높았다.
물론 G 범주보다 E나 S 범주의 상관관계가 더 낮았다는 연구 결과도 없지는 않다.
평가 대상 기업의 업종도 평가 등급 차이가 벌어지게 만든다. 에너지 부문은 상관관계가 0.55로 낮고, 기술이나 서비스, 금융 등은 0.74~0.77로 높은 편이다.
내구 소비재 및 통신 산업의 경우 E와 S 범주에서, 금융 서비스 회사의 경우 G 범주에서 가장 높은 등급 불일치를 기록했다.
대기업, 신용 등급이 없는 기업, ESG 공개가 더 나은 기업, 분석가가 더 많은 기업의 경우 불일치가 더 높다는 사실도 확인됐다. 더 많은 자료를 공개한다고 해서 등급 판정이 반드시 일치하지는 않는다는 것은 평가에 그만큼 주관적인 판단이 개입한다는 의미다. 공개 정보가 많을수록 평가자들이 주관적으로 판단하는, 객관적으로 점수를 매기기 어려운 정보도 그만큼 많아진다.
평가 등급의 불일치에도 불구하고 전체적으로는 기업의 ESG 공개가 높을수록 ESG 점수가 높아지는 경향이 있었다. 이는 현재 ESG 점수 측정이 더 많은 자원을 갖춘 대규모 회사를 선호한다는 것을 의미하기도 한다.
어느 정도 차이는 인정해야
평가 기관마다 서로 다른 결과를 내놓는다는 것은 평가 체계의 다양성이나 평가 기관의 특성에 비추어 자연스러운 결과라고 논문은 설명했다. 기업의 E, S, G 항목에 대해 일정 정도 주관적인 결론을 내릴 수밖에 없다는 것이다.
문제는 등급 불일치가 가져오는 모호성이 기업의 ESG 노력 자체를 저해할 수도 있다는 점이다. ESG 노력이 기업 주식이나 채권 가격에 정확히 반영되지 않는다면 기업으로서는 ESG 경영에 힘을 쏟을 필요를 못 느끼게 된다.
투자자도 등급 불일치가 나타나면 자신의 투자에서 명확한 근거를 찾지 못하게 된다. 명확한 근거가 없으면 많은 돈을 장기간 투자하기 어렵다.
이 때문에 ESG 평가에 사용되는 데이터를 표준화하고, 이를 바탕으로 평가 과정을 객관화, 과학화하자는 주장이 나온다. 평가 기관에 데이터 수집부터 평가 절차 등에 투명한 공개를 요구하기도 한다.
일부에서는 신용 등급 평가가 자리를 잡은 것처럼 장기적으로 ESG 평가도 표준화된 데이터 개발을 통해 일정한 방법론에 수렴할 것으로 전망한다. 또, 평가 기관의 인수합병을 통해 다양한 평가 방법이 몇 가지로 줄어들 것으로 기대한다.
일부에서는 반론도 있다. ESG 평가가 기존 재무 분석과는 달라야 한다는 점을 강조하는 목소리다. ESG 평가는 자연환경 보전 노력 등 기업의 비재무적 가치를 따지는 것인데, ESG 평가마저 금융 가치라는 잣대에 맞춰 진행하는 것이 과연 옳은 방향이냐 하고 우려한다.
결국, 당분간은 평가 등급 불일치를 놓고 논란은 계속될 수밖에 없다. 투자자로서는 여러 기관에서 나은 ESG 등급을 동시에 참고해야 하는 상황이다.
강찬수 환경신데믹연구소장