오늘은 사진 속 교각, 다리, 벽 등에 발생한 크랙을 인식하는 프로그램을 개발에 인공지능 기술을 활용하는 새로운 접근 방식에 대해 소개하고자 합니다. 교량과 건물은 우리 일상의 필수적인 구조물입니다. 그러나 시간이 지남에 따라, 이러한 구조물들은 크랙과 같은 여러 문제에 직면하게 되죠. 크랙은 단순한 미관의 문제에서부터 심각한 안전 문제에 이르기까지 다양한 영향을 미칠 수 있습니다. 이러한 문제를 식별하고 대응하기 위해선, 정기적인 점검과 빠른 대처가 필수적입니다.
이 프로그램의 목표는 인프라 시설물의 안전 진단을 자동화하고 효율성을 높이는 것일겁니다. 기존에는 인공지능을 활용하기 위해 대량의 데이터를 수집하고 모델을 학습시키는 방법이 주로 사용되었습니다. 하지만 이 과정은 시간과 자원이 많이 소모되며, 때로는 원하는 성능을 얻기 어려울 수 있습니다.
이에 저는 기존 방식과는 다른 접근 방법을 모색하던 중, 생성형 AI(Generative AI)를 활용하는 것이 효과적일 수 있다는 가능성을 발견했습니다. 생성형 AI는 기존 데이터를 바탕으로 새로운 데이터를 생성할 수 있는 인공지능 기술로, 최근 다양한 분야에서 주목받고 있습니다. 이 기술을 활용하면 대량의 데이터를 수집하고 모델을 처음부터 학습시키는 과정을 거치지 않고도, 원하는 결과를 얻을 수 있을 것으로 기대됩니다.
생성형 AI의 가능성을 확인하기 위해 ChatGPT와 Claude AI를 활용하여 실험을 진행해 보겠습니다.
먼저, 크랙이 발생한 교각, 다리, 벽 등의 사진을 준비하여 ChatGPT와 Claude AI에게 제공할 예정입니다. 이때 사진은 다양한 각도, 조명 조건, 크랙의 크기와 모양 등을 포함하도록 선별하여, 생성형 AI의 성능을 다각도로 평가할 수 있도록 하겠습니다.
다음으로, 각 AI 모델에게 사진을 입력으로 제공하고, 크랙의 위치, 크기, 형태 등을 감지하도록 요청할 것입니다. 이를 통해 생성형 AI가 실제 크랙을 얼마나 정확하게 인식할 수 있는지 확인할 수 있을 것으로 기대됩니다.
마지막으로, ChatGPT와 Claude AI의 결과를 분석하고 비교하여, 각 모델의 장단점과 특징을 파악하고자 합니다. 이 과정에서 얻은 인사이트를 바탕으로, 프로젝트에 가장 적합한 생성형 AI 모델을 선정하고, 필요에 따라 추가적인 fine-tuning을 진행할 수 있습니다.
ChatGPT Vision을 사용하여 프롬프트에 이미지를 사용할 수 있습니다
[논문]다중 모달 모델 GPT-4V의 탐구: 기능, 응용 및 미래 연구 방향
PDF 파일에서 파이썬으로 텍스트 추출하기: 종합 가이드
Please analyze the provided image and identify any cracks present on the surface of the structure (bridge, wall, etc.). For each crack detected, please provide the following information:
1. Location: Indicate the specific area or region where the crack is found. 2. Size: Estimate the length and width of the crack in metric units (mm or cm). 3. Shape: Describe the shape of the crack (linear, curved, branched, etc.). 4. Severity: Assess the severity of the crack on a scale of 1 to 5, with 1 being minor and 5 being critical.
Please provide your analysis in a clear, bullet-pointed format for easy comprehension.
ChatGPT는 “직접 이미지를 분석하여 크랙을 식별하고 그에 대한 정보를 제공하는 기능을 수행할 수 없다”고 답변하였고 Claude AI는 이미지 속 구조물은 교량이나 고가도로로 추정되며, 콘크리트 표면에 심각한 손상이나 결함은 보이지 않는다고 답변하였습니다.
ChatGPT의 답변은 직접 이미지를 분석하는 기능을 수행하지는 못하지만, 업로드하신 이미지를 설명해드릴 수는 있습니다. 그러나 크기나 심각도를 수치적으로 평가하는 것은 제 능력 범위를 넘어서는 일이기에, 다음과 같이 일반적인 설명을 하겠다고 하였습니다.
Claude AI의 답변은
제공된 이미지를 분석한 결과, 콘크리트 또는 시멘트 구조물의 표면에 선명한 크랙이 발견되었습니다. 감지된 크랙에 대한 정보는 다음과 같습니다:
- 위치: 크랙은 이미지의 중앙에 위치하며, 수직 방향으로 벽면을 가로지르고 있습니다.
- 크기:
- 길이: 크랙은 이미지 상단에서 하단까지 이어지므로, 정확한 길이를 추정하기는 어렵습니다. 다만, 이미지에 보이는 크랙의 길이는 약 50cm 이상으로 추정됩니다.
- 너비: 크랙의 너비는 일정하지 않으나, 가장 두꺼운 부분은 약 2-3mm 정도로 보입니다.
- 형태: 크랙은 전반적으로 선형에 가까우나, 완벽한 직선은 아닙니다. 크랙의 폭이 일정하지 않고 약간의 굴곡이 있으며, 일부 구간에서는 갈라지는 형태를 보입니다.
- 심각도: 크랙의 길이와 너비, 그리고 형태를 고려할 때, 심각도는 4로 평가됩니다. 크랙이 구조물의 상당 부분을 관통하고 있으며, 방치할 경우 구조적 안정성에 영향을 미칠 수 있을 것으로 판단됩니다.
종합적으로, 이미지 속 크랙은 콘크리트 구조물의 내구성과 안전성을 위협할 수 있는 수준으로 보입니다. 정확한 원인 파악과 적절한 보수 조치가 필요할 것으로 사료되며, 전문가의 정밀 진단을 통해 구조물의 상태를 면밀히 평가할 것을 권장합니다.
ChatGPT의 답변
이 사진은 콘크리트 구조의 기둥 또는 교각의 손상된 부분을 보여주고 있는데요, 명확한 크랙 뿐만 아니라 표면의 일부가 부서진 모습도 보입니다. 손상은 상당히 심각해 보이며, 전문가에 의한 구조적 평가가 필요할 것으로 보입니다. 그러나, 이미지에서 크랙의 정확한 위치, 크기, 형태를 추정하거나 심각도를 수치적으로 평가하는 것은 제 능력 밖의 일입니다. 이러한 평가는 현장 검사와 구조 엔지니어링 전문 지식을 요구합니다.
Claude AI의 답변
제공된 이미지를 보면, 콘크리트 구조물(교량이나 고가도로의 지지대일 가능성이 높음)에 상당한 크기의 균열 또는 파열이 발생한 것을 확인할 수 있습니다. 이 균열에 대한 세부 정보는 다음과 같습니다:
- 위치: 균열은 콘크리트 기둥의 수직면에 위치하며, 이미지의 상단에서 시작하여 아래로 뻗어 있습니다.
- 크기:
- 길이: 균열의 가시적인 길이는 이미지의 거의 전체 높이에 걸쳐 있으며, 이는 기둥의 상당 부분을 차지하는 것으로 보입니다. 구조물의 크기로 미루어 보았을 때, 균열의 길이는 수 미터에 달할 것으로 추정됩니다.
- 너비: 균열의 너비는 길이에 따라 다양합니다. 가장 넓은 지점에서는 약 5-10cm 정도의 너비를 가진 것으로 보입니다.
- 형태: 균열은 약간 불규칙한 경로를 따라가지만, 전반적으로는 선형에 가까운 형태입니다. 길이에 따라 균열의 폭이 넓어졌다 좁아졌다 하는 것으로 보입니다.
- 심각도: 균열의 상당한 길이와 너비, 그리고 구조적으로 중요한 지지대에 위치한 것을 고려할 때, 이 균열의 심각도는 1-5 척도에서 5로 평가할 수 있습니다. 이는 즉각적인 주의와 보수가 필요한 심각한 수준의 손상을 나타냅니다.
요약하자면, 이 이미지는 콘크리트 교량이나 고가도로 지지대에 발생한 심각한 수준의 대규모 균열을 보여줍니다. 균열은 구조물의 상당한 길이에 걸쳐 있으며 상당한 폭을 가지고 있어, 교량의 구조적 안정성을 잠재적으로 위협할 수 있는 심각한 수준의 손상임을 시사합니다. 이 문제를 해결하고 구조물의 안전을 확보하기 위해서는 구조 엔지니어에 의한 긴급 평가와 적절한 보수 조치가 강력히 권고됩니다.
ChatGPT의 답변
이 사진을 통해 볼 수 있는 것은 큰 교량의 여러 교각이 깨끗하고 견고해 보인다는 점입니다. 멀리서 찍힌 사진으로는 작은 균열이나 손상을 명확히 식별하기 어렵지만, 이 사진에서는 눈에 띄는 크랙이나 구조적 손상이 보이지 않습니다. 구조물의 상태를 보다 정확히 평가하기 위해서는 전문적인 검사가 필요합니다.
Claude AI의 답변
제공된 이미지를 보면, 고가도로 또는 교량 구조물을 지지하는 콘크리트 기둥에 여러 개의 균열 또는 결함이 있음을 관찰할 수 있습니다.
- 위치: 이미지 중앙에 위치한 콘크리트 기둥에 두 개의 수직 균열이 보입니다. 균열은 기둥의 상단 부근에서 시작하여 아래로 뻗어 있습니다.
- 크기:
- 길이: 두 균열 모두 기둥의 가시적인 높이 중 상당 부분을 차지하고 있으며, 구조물의 크기로 미루어 볼 때 길이는 수 미터에 달할 것으로 추정됩니다.
- 너비: 균열은 비교적 좁아 보이며, 몇 밀리미터 정도의 너비를 가진 것으로 추정됩니다. 그러나 이 거리에서는 정확한 너비를 판단하기 어렵습니다.
- 형태: 균열은 기둥을 따라 수직 방향으로 대략 선형의 경로를 따라 나타납니다. 콘크리트 표면에 얇고 직선적인 선의 형태로 보입니다.
- 심각도: 균열이 눈에 띄고 상당한 길이로 뻗어 있기는 하지만, 이 규모에서 볼 때 극단적으로 넓거나 명백한 구조적 문제를 일으키는 것으로는 보이지 않습니다. 보이는 정보만으로 판단했을 때, 심각도는 1에서 5 사이의 척도에서 3 정도로 초보적으로 평가할 수 있습니다. 그러나 더 정확한 평가를 위해서는 근접 조사가 필요할 것입니다.
요약하면, 이 이미지는 고가도로 또는 교량의 콘크리트 지지대에 두 개의 선형 수직 균열이 있음을 보여줍니다. 균열은 기둥의 상당한 길이에 걸쳐 있지만 너비는 비교적 좁아 보입니다. 근본적인 원인과 잠재적인 구조적 영향을 파악하기 위해 추가 조사가 필요하지만, 이미지에서 확인할 수 있는 제한된 정보만으로 볼 때 심각도는 중간 정도로 보입니다. 구조 엔지니어의 상세한 평가를 통해 실제 상태를 파악하고 필요한 보수 또는 유지 관리 조치를 권고받는 것이 바람직할 것입니다.
결론:
이번 실험을 통해 생성형 AI가 콘크리트 구조물의 균열을 분석하는 데 활용될 수 있는 가능성을 확인하였으나, 동시에 몇 가지 한계점도 발견하였습니다. 우선, 인터넷에서 찾은 사진만으로는 균열의 존재 여부를 정확히 판단하기 어려웠습니다. 이는 사진의 해상도와 촬영 거리 등이 분석 결과에 큰 영향을 미칠 수 있음을 시사합니다. 따라서 보다 선명하고 근접 촬영된 고해상도 사진을 사용하여 분석의 정확도를 높일 필요가 있을 것입니다.
또한, 프롬프트를 더욱 세밀하게 작성하여 AI 모델이 균열의 특징을 구체적으로 파악할 수 있도록 유도하는 것이 중요해 보입니다. 이를 위해 균열의 위치, 크기, 형태, 심각도 등을 자세히 기술하고, 필요한 정보를 명확히 요청하는 프롬프트 설계가 필요할 것입니다.
마지막으로, 분석 결과의 신뢰도를 높이기 위해 여러 언어 모델을 활용하여 결과를 상호 검증하는 파이프라인을 구축하는 것이 도움이 될 수 있습니다. 이를 통해 모델 간 일관성을 확인하고, 잠재적인 오류를 최소화할 수 있을 것으로 기대됩니다.
이러한 점들을 고려하여 생성형 AI를 활용한 콘크리트 구조물 균열 분석 시스템을 보다 정교하게 설계하고, 실제 활용 가능성을 높일 수 있는 방안을 모색해 나가야 할 것입니다.