陳 鴻基

株式会社クウゼン / エンジニア

陳 鴻基

株式会社クウゼン / エンジニア

興味は大事

Web系自社サービス(Retrieval-Augmented Generation)を運営する企業でエンジニアとして半年以上のアルバイトを行なっています。主にFlaskに基づいて、Pytestとunittestでコードをテストしたり、DockerとCircleCIを使ってクローラーを実装したりしています。例えば、OCRの技術を実装し、PDFのクロールを最適化することです。入社した時、私はクローラーの経験を持っていたので、初めての開発会議で会社が悩んでいたクローラー改善

  • Search_similar_context_by_Opensearch_and_Langchian

    This project provides a Python script for loading unstructured text data, splitting it into chunks by Langchain, and processing it with OpenSearch to get a vector representation of each chunk. These vectors can then be used for various natural language processing tasks, such as text classification, semantic similarity comparison, or information retrieval. I also use OpenAI's GPT model to query so that I can get response for searching similar context, or other NLP tasks can be done by GPT model.

  • 詐欺被害投稿サイトのクローラ

    It's a crawler used for scraping fraud information in database of open-source website.

  • CNNによる銀座伊東屋の筆の分類

    1.今回提案したテーマは銀座伊東屋の筆の分類です。 2.コロナ禍政策が緩和したため、国内と海外の顧客が増えています。 ですから、毎日閉店後のペンの分類は大変です。 3.そこで、私はCNNを搭載した機械で分類することを提案しました。 つまり、ペンを機械に入れて、機械学習モデルによる分類を経て、内部の重力と仕切り板を利用してペンを異なる箱に分けることです。でも、技術的な問題はa.浅いと深い同色物体の分類は難しいかもしれないです。 4.私は四つのペンの画像を15枚ずつ収集しました。12枚を訓練データとして、水増しのためにノイズ追加しましたので、訓練画像数は96です。最後の精度結果は77%でした。 苦労した点は、ImageDataGeneratorを使った回転処理を試したが、あんまり効かなかったんです。最終的には同じ角度での笔の再撮影しました。 5.結果に対して、誤分類は全部浅い緑と深い緑の間で発生しました。画像サイズを向上して、よりはっきりな画像で訓練した方がいいかもしれません。さらに、色に対して強い特徴を抽出手法も知るべきです。また、自動パラメーター調整ツールを使用してみたいです。

Ambition

In the future

優れたエンジニアになりたい

About 株式会社クウゼン

株式会社クウゼン7 months

エンジニア(Intern)Present

- Present

1. 現行のプロジェクトにおける生成AI技術の開発と最適化に貢献 2. 既存のコードベースの理解と改善 3. チームと連携し、技術的な問題解決と知識の共有

東京大学大学院(Graduate School, The University of Tokyo)2 years

東京大学

-

ニューラルネットワークによるドローン搭載レーダの電力設備の区別

楽天グループ

新規プロトタイプ開発 (application engineer)(Intern)

チームに課せられるミッションは新規プロトタイプ開発。テーマに沿ってDesign、Planning、Developmentと開発の1通りの流れを経験するコースです。 チームワークでdjangoを用いてスーパーの割引情報がアップできる、割引中のスーパと食物が検索できるwebアプリケーションを作りました。自分はバ

日本コントロールシステム

エンジニア(Intern)

社内の主力製品の一部機能の追加、あるいは不具合修正を担当していただく予定です。 半導体設計データの変換処理や製造誤差の補正処理などを行う製品で、 半導体の「原盤」であるフォトマスクの製造プロセスで利用するソフトウェアに

South China University of Technology4 years

Electrical engineering and its automation

-

電気工学


Skills

  • Python

    0
  • 学習欲

    0
  • Git

    0
  • ニューラルネットワーク

    0
  • Linux

    0
  • English, Japanese, Docker and 5 skills

Accomplishments / Portfolio


言語

  • English - Professional
  • Japanese - Professional
  • Chinese - Native
  • Cantonese - Professional

Receive Scouts from companies