머신러닝과 딥러닝 3 23.05.01.( 월 ) 김형진 화학물질특성화대학원 랩미팅Overview 목차 1. 요약 2. 도입부 3. 방법론 가 . 워크플로 나 . 시나리오 마 . 입력 및 출력 전략 사 . 입력 및 출력 데이터 준비 4. 수치 사례 연구 가 . PHAST 설정 나 . 센서배치 다 . 신경망의 입력과 출력 5. 결과 및 고찰 가 . 예측결과 나 . 염소기둥의 존재 유무 분석 6. 결론요약 가스검출기 , 신경망 및 가스분산모델의 통합에 의한 유해가스 분산의 실시간 추정도입 PHAST 프로그램 ( 가스분산모델 ) 사용 PHAST 프로그램 + 가스감지기 + ANN 의 통합 PHAST 시뮬레이션에서 지형효과 제외 ( 이전 연구에서 신경망의 정확도에 영향을 미치는 매개변수를 분석한 결과 풍향과 속도가 가장큰 영향을 미쳤으며 , 대기 안정성과 액체 누출의 배출속도가 그 뒤를이었습니다 .)방법론 통합모델의 워크플로도입부 일반 시나리오 3 개 이상의 감지기 작동해야 2 차원의 지상 가스 분산을 예측함 (3-o-o-4)=working number도입부 일반 시나리오방법론 입력 및 출력방법론 입력 및 출력 N 개의 시나리오를 해석 , working number 는 3 이상인지 확인후 계산값 출력수치 사례 연구 PHAST 설정 단일탱크 50T 염소 저장 염소는 3 ℃ 0bar, 11 ℃ 20bar 로 저장 지상 2m 높이 탱크 바닥에 위치한 구멍에서 액체염소가 방출 공기온도는 1 ℃ 20bar, Pasquill stabilit 에 따른 풍속 범위 설정 (A~F), A 가 가장 불안정 , F 가 가장 안정하여 F 에서는 대기확산이 잘 이루어지지 않는다 . 변수는 (1) 보어직경 , (2) 저장압력 , (3) 대기 안정성 , (4) 풍속수치 사례 연구 PHAST 설정 4886 개의 시나리오 (12*2*111+11*2*101)수치 사례 연구 센서 배치 X 축 : 베타값 ( 베타각도 ) Y 축 : working ratio (a) 는 알파값의 변화에 따른 working ratio 를 보여준다 . (b) 는 L 값의 변화에 따른 working ratio 를 보여준다 . (c) 는 d 값의 변화에 따른 working ratio 를 보여준다 . (d) 는 베타 max 값을 찾은 알파 , L, d 에 따른 그래프 를 도시하였다 . 베타 max:19.4 ˚ , 95% 작업비율수치 사례 연구 신경망의 입력과 출력 풍향은 -20 ˚ ~ 2 ˚ 로 설정 TAG( 타겟 ) 은 x 축 900m~2200m 까지 , y 축 -100m 에서 100m 까지 설정 TAG( 타겟 ) 은 32 개의 표적 위치 설정결과 및 고찰 예측결과 (a),(b) 는 25% 의 검증데이터 결과 (c),(d) 는 75% 의 학습데이터 결과 MSE 값은 상하 유사 R 값은 상하 동일 즉 , 검증데이터와 학습데이터의 일치로 학습이 잘 되었음 .결과 및 고찰 예측결과 (a)~(f) 까지 대기 안정성 A~F 까지에 따른 MSE 와 R 값을 나타냄 최소 MSE 는 (c) 에서 나타나고 최대 MSE 는 (f) 에서 나타남 위의 이유는 대기안정성이 F 일때 낮은 풍속으로 교란이 잘되기 때문에 ANN 에 의한 회귀분석이 잘 되지 않는다 . C,D 에서는 염소가스의 하강에 긍정적 영향을 미친다 . A,B 에서는 불안정성이 커서 오염물질의 희석을 방해함 .결과 및 고찰 염소기둥의 존재 유무 분석 앞의 그림 2 에서 W1(Tag1 에서 기둥의 중심선까지의 수직거리 ), W2(Foot1 에서 깃털의 절반 너비 ) L_F(Foot1 에서 소스까지의 거리 ), L_max ( 유해화학물질의 최대 분산거리 ) 앞장에서 제시한 W1, W2, L_F, L_max 값 모두 PHAST 값과 ANN 값이 일치한다 .결과 및 고찰 염소기둥의 존재 유무 분석 [(LF/ Lmax )net] f:ANN 의 LF/ Lmax 값을 0 또는 1 로 변환한다 . 1 값일 경우 0 으로 1 값일 경우는 1 로 내린다 . 이렇게 해서 0 또는 1 값을 얻은다음 ANN 값 -PHAST 값을 해서 LF/ Lmax 값 ,W1/W2 값을 구해서 그래프에 표시를 한다 . Table4 를 보면 , FN 값과 FP 값 모두 1% 미만의 값이 나왔다 . Table5 를 보면 , FN 값과 FP 값의 Combined 값이 나왔고 모든 수를 합하면 8190 이 된다 . 올바르게 예측된건 98.29% 이다 .결론 PHAST, ANN, 가스감지기를 통합 단일 PHAST 시뮬레이션을 약 몇분 안에 완료 가능하나 ANN 을 적용해야 누출속도 및 위치 수집 가능 향후 시설 레이아웃 , 장애물 및 경계가 있는 3D 시나리오 분석이 필요Thank you for your Attention{nameOfApplication=Show}
MSE값의 최소인 모델을 선정R값은 0.99이상인 모델을 선정위와 같은 모델을 사용시 CFD와 ANN의 우수한 결합을 화공안전에 적용가능하지만 기존에 사용되어지던 ANN모델을 사용하여 학습하였기 때문에 신경망은 블랙박스로 취급되어 지므로 다양한 조건에 대해서는 더 많은 시나리오를 학습시켜야 한다.
머신러닝과 딥러닝 1 23.04.10.( 월 ) 화학물질특성화대학원 랩미팅Overview 목차 논문소개 2. 개념 및 알고리즘 가 . 나이브 베이즈 분류 ( 지도학습 ) 나 . 선형판별분석 ( 지도학습 ) 다 . K- 최근접 이웃 ( 지도학습 ) 라 . 서포트 벡터 머신 ( 지도학습 ) 마 . 랜덤 포레스트 ( 지도학습 ) 바 . 그레디언트 부스트 ( 지도학습 ) 사 . K- 평균 군집화 ( 비지도학습 ) 아 . 계층적 군집화 ( 비지도학습 ) 자 . 밀도 기반 클러스터링 ( 비지도학습 ) 차 . 신경망 ( 지도학습 )논문소개 화학보건 및 안전에 대한 기계학습 및 딥 러닝 : 기술 및 응용 분야에 대한 체계적인 검토개념 및 알고리즘 기계학습 개념 지도학습 : 분류와 회귀로 이루어져 있으며 정답이 있는 데이터를 활용해 데이터를 학습 비지도학습 : 정답이 없는 데이터를 활용하여 결과를 예측 하며 대표적으로 클러스터링이 있다 . 강화학습 : 자신이 한 행동에 대해 보상을 받으며 학습 대표적으로 DQN 과 A3C 가 있으며 이 알고리즘은 딥러닝을 강화학습에 적용한 사례이다 . 학습방법 파이썬과 라이브러리등 코딩만 학습하여도 기본적인 머신러닝 딥러닝이 사용 가능하나 화학안전에서의 머신러닝과 딥러닝을 적용하기 위해서는 선형대수학 , 미분적분학 , 공업수학등 기본적인 인공지능 수학을 학습하여야 한다 . 발표내용 파이썬 , 라이브러리등 코딩을 학습하기 전에 AI 논문또는 깊이있는 학습을 위하여 논문에서 소개하는 개념과 알고리즘을 다루었다 .개념 및 알고리즘 나이브 베이즈 분류 나이브 가정 ( 조건부 독립 ) 조건부 확률 위 식의 분자 =p( x|Ck ) 나이브 베이즈 분류개념 및 알고리즘 선형판별분석 데이터 D ={x} i N 평균값 W 벡터에 projection 된 평균 분산값 (∑, 공분산행렬 , x 가 D 차원 벡터일 때 DxD matrix) 위 그림의 분산값 , 평균값 w 벡터를 구하기 위한 식 , w 의 최대값을 구한다 . 분자는 전체분산이므로 넓어져야 하므로 분산값이 커야하고 , 각각의 분모값은 좁아야 하므로 분산값이 작아져야 한다 . 그래서 w 의 최대값을 구하면 w 벡터를 구할수 있다 . 위의 식에 미분을 하여 0 값을 찾게 되면 최대값을 구할수 있다 .개념 및 알고리즘 K- 최근접 이웃 (K-NN) 주변의 가장 가까운 K 개의 데이터를 보고 데이터가 속할 그룹을 판단하는 알고리즘 , 거리를 측정할때는 유클리디안 거리를 사용 빨간 삼각형의 속할 그룹은 ? K=1 일때 , K=3 일때 그룹이 다르다 초록 사각형의 속할 그룹은 ? 유클리디안 거리 (= 피타고라스 정의 )개념 및 알고리즘 서포트 벡터 머신 서포트 벡터 정의 서포트 벡터의 경계조건 최적화문제 마진값 :개념 및 알고리즘 랜덤 포레스트 V 집합의 정의 V 부분집합의 정의 I= 정보획득량 , H(S)= 섀넌 엔트로피 섀넌 엔트로피 이 수식이 나타내는 의미는 H(S) 즉 섀넌 엔트로피 값이 작아져야 I 값이 커지므로 정보획득량이 증가하는 것이다 .개념 및 알고리즘 그레디언트 부스트 Loss function 의 정의 , Y 는 실제값 , f(x) 는 모델 예측값 Loss function 의 편미분 D 는 그레디언트값 ( 실제값 - 모델값 ) 의 총합을 더한것개념 및 알고리즘 계층적 군집화 군집화 예시 u 군집과 v 군집 사이의 거리 u 군집의 중심점 가중거리방법 :s 와 t 가 합쳐져 u 군집이 생기면 그 중심은 s 와 t 의 평균이다 . 와드거리방법 : 가중거리방법의 변형개념 및 알고리즘 K- 평균 군집화 V 값 ( 분산 ) 이 최소화 되는 Si 값을 찾는게 K 평균 군집화의 목적이다 . 전체분산값 Xj 는 임의표본 , ui 는 k 개의 군집중 i 번째 군집의 중심 , Si 는 집합들이 모인 한 군집 각 클러스터에 있는 데이터들의 무게중심값으로 재설정 군집화를 위하여 유클리드 거리를 계산하여 데이터 배당한다 . 빨간색 , 초록색 , 파랑색 점은 임의로 설정한 군집의 중심개념 및 알고리즘 밀도 기반 클러스터링 (DBSCAN)개념 및 알고리즘 신경망개념 및 알고리즘 신경망 신경망 정의 : Input 값에 의해서 함수값을 거쳐 Output 값이 나오게 된다 . 단층 퍼셉트론 : 계단함수 사용 다층 퍼셉트론 : 시그모이드 함수 사용향후계획 논문마무리 딥러닝 원리 소개 머신러닝과 딥러닝에 사용되는 소프트웨어 소개 머신러닝과 딥러닝을 적용한 화학안전 분야 소개 논문결론 검토 AI 학습에 필요한 수학 ( 선형대수학 , 미분적분학 , 공업수학 ) 학습 단순 머신러닝과 딥러닝을 활용하는 수준이 아닌 화학안전의 적용을 위해 필수적인 AI 수학을 학습하여 이해하기 쉽게 풀이Thank you for your Attention{nameOfApplication=Show}
환경위해성평가목 차제1장 위해성 평가의 개요1. 용어정의 및 관련법규12. 위해성 평가의 기본 개념13. 위해성 평가 도입 배경 및 필요성24. 화학물질 등록 시에 유해성 및 위해성 제출자료 35. 위해성평가의 대상물질 선정 및 구체적 방법 6제2장 유해성 확인1. 용어정의 122. 화학물질의 양면성 123. 관련 법규 134. 화학물질의 유해성 시험방법 165. QSAR 196. 논문 Review 22제3장 노출량-반응 평가/종민감도분포 평가1. 용어 정의 372. 노출량-반응 상관성 평가의 개념 373. 관련 법규 404. 논문 Review 43제4장 노출 평가1. 용어정의 522. 일상생활 속 화학물질 노출 523. 관련 법규 534. 제품의 사용에 대한 노출 평가 565. 논문 Review 57제5장 위해도 결정1. 용어정의 732. 허용가능 노출수준에 따른 위해도 결정 733. 관련 법규 734. 위해도 결정의 예 755. 논문 Review 76제6장 위해성 관리1. 용어정의 892. 위해성 평가와 위해성 관리의 연관성 893. 위해성 관리의 필요성 904. 위해특성 분류 905. 위해특성별 소통전략 916. 위해도-비용 분석 917. 위해성 저감 928. 논문 Review 93부록. 관련법규의 세부내용 11제1장 위해성 평가의 개요1. 용어정의 및 관련법규○ “유해성”이란 화학물질의 독성 등 사람의 건강이나 환경에 좋지 아니한 영향을 미치는 화학물질 고유의 성질을 말하며, 발암성 등 인체독성과 가연성 등 물리?화학적 성질이 있음.○ “위해성”이란 유해성이 있는 화학물질이 노출되는 경우 사람의 건강이나 환경에 피해를 줄 수 있는 정도를 말하며, 미래에 발생할 위험과 재해 사건에 대한 불확실성을 내포하며 질병의 발생, 폭발 및 화재로 인한 손실 등이 있음.○ “위해성 평가(risk assessment)”란 유해성이 있는 화학물질이 사람과 환경에 노출되는 경우 사람의 건강이나 환경에 미치는 결과를 예측하기 위해 체계적으로 검토하고 평가하는 것을 말함.○ 「화학물질의 등록 및 평가 등에 관한 법률」(이하 “법”이라 한다), 동법의 시행령 및 시행규칙 중에서 화학물질의 위해성 평가와 관련한 내용은 다음과 같으며, 이들의 구체적 내용은 부록에 나타내었음.- 법률 : 제10조, 제12조, 제14조, 제18조~제24조, 제33조- 시행령 : 제13조, 제16조~제18조- 시행규칙 : 제5조, 제23조~제34조, 제43조2. 위해성 평가의 기본 개념○ 사전(예방)주의 원칙(precautionary principle) : 보수적인 접근○ 명확한 결정을 내리기에 ‘충분한’ 지식을 얻을 때까지 새로운 기술의착수를 지연시키거나 현재의 활동을 줄일 것을 촉구하는 관리 철학→ 디디티 규제, 방폐장 등의 사건○ 인체 및 생태계에 유해한 화학물질 노출이 발생할 경우에 위해성(risk)은 유해성(hazard)과 노출량(exposure)의 산관관계로 산정→ Risk = (hazard, exposure)3. 위해성 평가 도입 배경 및 필요성○ 환경오염으로 인한 문제의 인식 확산.○ 일반적인 사고로 인한 위해성은 문서화 되어 정량화가 잘 되어있음.예) 자동차 사고 및 태풍 등 피해○ 그러나 담배 및 음주 등에 기인한 화학물질의 위해성은 정 량화 하기 어려우며 미량으로 눈에 보이지 않음.→ 사람들은 눈에 보이는 사고에 큰 위해를 느끼며 행동하지만, 때로는 보이지 않는 것들이 보다 더 큰 위해성을 나타내고 있음.○ 따라서 화학물질 노출에 대한 미래 피해의 과학적 예측 방법 필요.4. 화학물질 등록 시에 유해성 및 위해성 제출자료화학물질의 유해성 및 위해성에 관한 평가내용은 「화학물질의 등록 및 평가 등에 관한 법률」 제14조제1항에 따라 화학물질의 등록신청 시에 제출되어야 함. 화학물질의 등록·평가 절차는 [그림 1-1]에 보여지며, 제출자료는 다음과 같음. (기존화학물질들 중에서 등록대상물질은 등록하고 나머지는 등록면제이나 제조/수입/판매현황에 대해서 보고의무), (유독, 제한/금지, 허가의 물질 지정) (안전기준 제시 및 고시 의무를 미준수하면 판매금지/회수조치하고 준수(←미고시)하면 생산/수입 승인)[그림 1-1] 화학물질의 등록·평가 절차4.1 화학물질 등록 시의 제출자료(법14조)○ 신청인 정보- 제조·수입자 정보 : 명칭, 소재지, 대표자, 전화번호, 팩스번호, 메일주소- 국외제조자가 선임한 자를 통한 등록의 경우 : 국외제조자 및 선임한 자 정보(상호, 소재지, 연락처 등)- 공동제출의 경우 : 대표자 및 구성원 정보(상호, 대표자, 사업자번호, 주소, 연락처 등)- 위탁 제조하는 경우 : 수탁자 정보(상호, 소재지, 연락처 등), 계약서 등 위탁을 증명하는 서류○ 물질식별정보 : 화학물질명(IUPAC명, CA명, ISO 일반명 등), 분자식·구조식, 고유번호(CAS No., 기존화학물질번호(KE번호), 유독물질 번호 등), 상품명, 순도(화학물질 내 주요 구성 물질이 차지하는 중량비율(%)), 확인된 불순물·부산물의 화학물질명 및 함량○ 화학물질용도(시행규칙 별표8) : 용도분류체계상 용도, 확인된 용도 설명자료, 사용하지 말아야 하는 용도○ 분류 및 표시(시행규칙 별표7) : 화학물질의 분류는 물리적 위험성, 건강 유해성, 환경 유해성 등이고, 표시내용은 화학물질 명칭, 그림문자, 유해성을 알리는 문구 등○ 유해성 자료 등 화학물질 등록자료 항목수(시행규칙 별표1, 별표4)*괄호 안의 숫자는 시험계획서 대체 제출이 가능한 유해성 항목이며, T의 단위는 ton. 구 분0.1≤T