Spaces:

soojeongcrystal
/

hybridRAG

Sleeping

App Files Files Community

soojeongcrystal commited on Sep 7

Commit

3db0045

•

1 Parent(s): 14a8a48

Update app.py

Browse files

Files changed (1) hide show

app.py +39 -18

app.py CHANGED Viewed

@@ -1,23 +1,34 @@
 import gradio as gr
 import pandas as pd
 import matplotlib.pyplot as plt
-# 직원 데이터를 분석하여 교육 프로그램을 추천하고 결과를 시각화하는 함수
 def analyze_data(employee_file, program_file):
     # 직원 데이터와 교육 프로그램 데이터 불러오기
     employee_df = pd.read_csv(employee_file.name)
     program_df = pd.read_csv(program_file.name)
     # 직원별 추천 프로그램 리스트
     recommendations = []
-    for _, employee in employee_df.iterrows():
         recommended_programs = []
-        for _, program in program_df.iterrows():
-            # 직원의 현재 역량과 학습 목표를 기반으로 적합한 프로그램을 추천
-            if any(skill in program['skills_acquired'] for skill in employee['current_skills'].split(',')) or \
-               employee['learning_goal'] in program['learning_objectives']:
                 recommended_programs.append(f"{program['program_name']} ({program['duration']})")
         if recommended_programs:
@@ -27,26 +38,36 @@ def analyze_data(employee_file, program_file):
         recommendations.append(recommendation)
-    # 결과를 텍스트로 반환
     result_text = "\n".join(recommendations)
-    # 시각화용 차트 생성
-    plt.figure(figsize=(8, 4))
-    employee_roles = employee_df['current_role'].value_counts()
-    employee_roles.plot(kind='bar', color='skyblue')
-    plt.title('직원별 현재 직무 분포')
-    plt.xlabel('직무')
-    plt.ylabel('직원 수')
-    # 차트를 반환
     plt.tight_layout()
     return result_text, plt.gcf()
 # Gradio 인터페이스 정의
 def main(employee_file, program_file):
     return analyze_data(employee_file, program_file)
-# 사이드바에서 파일 업로드 기능 구현
 with gr.Blocks() as demo:
     with gr.Row():
         with gr.Column(scale=1):

 import gradio as gr
 import pandas as pd
+from sentence_transformers import SentenceTransformer
+from sklearn.metrics.pairwise import cosine_similarity
+import networkx as nx
 import matplotlib.pyplot as plt
+# Sentence-BERT 모델 로드
+model = SentenceTransformer('all-MiniLM-L6-v2')
+# 직원 데이터를 분석하여 교육 프로그램을 추천하고 그래프를 그리는 함수
 def analyze_data(employee_file, program_file):
     # 직원 데이터와 교육 프로그램 데이터 불러오기
     employee_df = pd.read_csv(employee_file.name)
     program_df = pd.read_csv(program_file.name)
+    # 직원 역량과 프로그램 학습 목표를 벡터화
+    employee_skills = employee_df['current_skills'].tolist()
+    program_skills = program_df['skills_acquired'].tolist()
+    employee_embeddings = model.encode(employee_skills)
+    program_embeddings = model.encode(program_skills)
+    # 유사도 계산
+    similarities = cosine_similarity(employee_embeddings, program_embeddings)
     # 직원별 추천 프로그램 리스트
     recommendations = []
+    for i, employee in employee_df.iterrows():
         recommended_programs = []
+        for j, program in program_df.iterrows():
+            if similarities[i][j] > 0.5:  # 유사도 임계값 기준
                 recommended_programs.append(f"{program['program_name']} ({program['duration']})")
         if recommended_programs:
         recommendations.append(recommendation)
+    # 결과 텍스트
     result_text = "\n".join(recommendations)
+    # 네트워크 그래프 생성
+    G = nx.Graph()
+    for employee in employee_df['employee_name']:
+        G.add_node(employee, type='employee')
+    for program in program_df['program_name']:
+        G.add_node(program, type='program')
+    for i, employee in employee_df.iterrows():
+        for j, program in program_df.iterrows():
+            if similarities[i][j] > 0.5:  # 유사도 임계값
+                G.add_edge(employee['employee_name'], program['program_name'])
+    # 그래프 시각화
+    plt.figure(figsize=(10, 8))
+    pos = nx.spring_layout(G)
+    nx.draw(G, pos, with_labels=True, node_color='skyblue', node_size=2000, font_size=10, font_weight='bold')
+    plt.title("직원과 프로그램 간의 관계")
     plt.tight_layout()
     return result_text, plt.gcf()
 # Gradio 인터페이스 정의
 def main(employee_file, program_file):
     return analyze_data(employee_file, program_file)
+# Gradio 블록
 with gr.Blocks() as demo:
     with gr.Row():
         with gr.Column(scale=1):