株式会社AVILEN / AI開発
AVILENデータクリーニングプロジェクト:時系列統合ガイド
3つの異なるデータタイプを処理するためのデータクリーニング手法に関する包括的なドキュメントを作成: * コンテナ運賃データのPDFから構造化CSVへの変換 * 複数国の市場状況データの統合 * ブラジルの輸出データを分析可能な時系列データへ変換 * 日本語テキスト処理とマルチフォーマットデータ統合の専門知識を実証
Discover companies you will love
株式会社AVILEN / AI開発
AIのアイデアを迅速にビジネス成果につなげるために、エンジニアリングリーダーをサポートしています。プロダクトマネジメントとAI開発の両方のバックグラウンドを持つ私だからこそ、複雑な技術的ソリューションを測定可能なビジネス価値に変換することができます。
次のような役割を提供できる、先進的なテック企業に参画したいと考えています: - 測定可能なビジネスインパクトをもたらすAIプロジェクトのリード - 技術チームとビジネスチームの間のコミュニケーションギャップを埋める
- AVILENのAI技術調査プロジェクトで10以上のOSSとAPIを評価し、文書検索、構造化、要約機能の実装提案を行う
- 時系列データ分析のためのデータ処理パイプラインと特徴量エンジニアリングを実装 - LightGBMを使用して販売価格予測モデルを開発し、MAPE 2.04%を達成 - 主要な国際市場の輸出データを分析し、視覚化
小林康太 AVILENのデータサイエンティスト兼マネージャー 2024年9月25日 Josephさんのプロジェクトに対する姿勢や実装力にはいつも助かっています。我々のバリューである"野心ある素直さ"があり、時系列データを用いたコード実装のアウトプットはいつも期待値を超えていました。 - プロジェクトに対する姿勢 "野心ある素直さ" がある - 与えられた業務はもちろんのこと、それ以外の"こうしたらどうか?"という積極的な姿勢がある - 少し抽象的な業務でも、ご自身でタスクに分解して期待以上のアウトプットを出せる - コードの実装力がある - 以下のことをPJTのではやっていただきました - データ前処理全般 - 時系列データを用いた特徴量エンジニアリング - LightGBMの実装 - モデルの改善 - リファクタリング - すべて期待値を超えており、時系列のコードの実装力については強く推薦致します
2025年12月までのN2取得を目標として設定
LLMアプリケーション開発のためのLangChain - フレームワークの開発者であるハリソン・チェイスから直接LangChainを学ぶ - 自社データにLLMを適用して、パーソナルアシスタントや専門的なチャットボットを構築する
- WilDoc(外国人向け文書理解アプリ)の設計・開発 - Flutter/Firebase/GPT-4を活用したMVP開発 - プロダクト要件定義からUI/UX設計まで担当
- Learned the fundamentals of gradient boosting and built machine learning models using XGBoost to solve classification and regression problems - Learned about ARIMA models in Python for time series analysis
- カスタムGPTを統合したモバイルWebアプリの開発 - WhatsAppとLINE向けAIアシスタントの実装 - メンターからのフィードバックに基づく迅速な改善サイクルの実施
- 大規模言語モデルを使用した多段階システムを効率的に構築 - マルチステージプロンプトを使用して複雑なタスクをサブタスクのパイプラインに分割する手法を習得 - 安全性、正確性、関連性の観点からLLMの入出力を評価する方法を学習
AIドリブンのフィットネスアプリ開発: - GPT-4を活用したパーソナライズドワークアウト生成システムの実装 - Flutter/Firebaseによるプログレッシブウェブアプリの開発 - UIデザインからバックエンド実装までの一貫した開発管理
● Pioneered weekly interviews, identified and prioritized customers’ issues, created ideation processes, evaluated best solutions, identified hidden assumptions, and designed assumption tests, helping stakeholders clarify their vision of the product along the way.
● Assembled a data science solution to a basic flask app where an emergency worker can input an emergency disaster message and get classification results in several categories. ● Build a recommendation engine, based on user behavior and social network in IBM Watson Studi
• Investigated disaster data from Figure Eight to build a model using ETL and ML pipelines for an API that classifies disaster messages, and built visualizations of the data in the web app. • Assembled a web app where an emergency worker can input a new message and get classification results in several categories.
● Investigated questions through user research, and translated the results into product requirements and functional specifications that increased the perceived benefit of the product.
● Developed expertise in data manipulation and visualization using Python libraries such as pandas, NumPy, and Matplotlib ● Acquired statistical and machine learning skills through hands-on training with real-world datasets.
- 予測および二値分類タスク向けの教師あり学習モデル(線形回帰、ロジスティック回帰)の構築・訓練を実施 - 実世界のデータやタスクに対してモデルが一般化できるよう、機械学習開発のベストプラクティスを適用 - クラスタリングや異常検知などの教師なし学習手法を活用
● Acquired mathematical skills and knowledge through the High School Math Mastery course. ● Acquired skills in HTML/CSS, JavaScript, and SQL through the Intro to Programming courses and projects.
● Significantly improved clients' health and fitness through effective training and the use of the CrossFit methodology. ● Helped numerous clients become fitter and healthier through quality coaching and training plans.
• Developed expertise in accessing and manipulating data using Python code • Acquired skills in using Python to retrieve and process data from web-based APIs.
• Built an in-person instruction model around the best free content for each subject, with mentoring combining 14 different learning strategies to maximize the learning rate. • Taught and mentored homeschoolers in early math and introduction to computer programming using Khan Academy, English with Duolingo, and Fitness with Crossfit.com.
● Coordinated logistics for the purchase and shipment of weekly orders, managing all aspects of the supply chain. ● Conducted market research and analyzed free data sets from Bogota city on mandarin prices to establish a regular pricing strategy, demonstrating expertise in data analysis and market research.
• Organized CRM Pipelines in Pipedrive to better visualize the stages of the leads and contact them at the right time. • Made strategic product suggestions in the programming of the curriculum to improve the experiences of the students who missed some classes.
株式会社AVILEN / AI開発
3つの異なるデータタイプを処理するためのデータクリーニング手法に関する包括的なドキュメントを作成: * コンテナ運賃データのPDFから構造化CSVへの変換 * 複数国の市場状況データの統合 * ブラジルの輸出データを分析可能な時系列データへ変換 * 日本語テキスト処理とマルチフォーマットデータ統合の専門知識を実証