File EnsemblGene.java

Branches:

Statements:

160

Methods:

Classes:

LOC:

703

NCLOC:

409

Total complexity:

Complexity density:

0.38

Statements/Method:

5.52

Methods/Class:

Average method complexity:

2.07

Classes

Class	Line #	Total Statements	Complexity	Uncovered Elements	TOTAL Coverage	Actions
EnsemblGene	52	160	60	177	0.2775510327.8%

Class EnsemblGene

Class EnsemblGene	Line # 52	Total Statements 160	Complexity 60	Uncovered Elements 177	TOTAL Coverage 0.2775510327.8%
EnsemblGene() EnsemblGene()	7070	1.01	1.01	0.00	1.0 1.0100%
EnsemblGene(String) EnsemblGene(String)	8080	1.01	1.01	1.01	0.0 0.00%
getDbName() : String getDbName() : String	8585	1.01	1.01	0.00	1.0 1.0100%
getFeaturesToFetch() : EnsemblFeatureType[] getFeaturesToFetch() : EnsemblFeatureType[]	9191	1.01	1.01	1.01	0.0 0.00%
getSourceEnsemblType() : EnsemblSeqType getSourceEnsemblType() : EnsemblSeqType	9797	1.01	1.01	1.01	0.0 0.00%
getObjectType() : String getObjectType() : String	103103	1.01	1.01	1.01	0.0 0.00%
getSequenceRecords(String) : AlignmentI getSequenceRecords(String) : AlignmentI	136136	14.014	4.04	20.020	0.0 0.00%
findGeneLoci(SequenceI,String) : void findGeneLoci(SequenceI,String) : void	186186	4.04	2.02	6.06	0.0 0.00%
parseChromosomeLocations(SequenceI) : boolean parseChromosomeLocations(SequenceI) : boolean	206206	19.019	7.07	27.027	0.0 0.00%
getGeneIds(String) : List<String> getGeneIds(String) : List<String>	246246	11.011	4.04	17.017	0.0 0.00%
getTranscripts(AlignmentI,String) : void getTranscripts(AlignmentI,String) : void	292292	5.05	1.01	5.05	0.0 0.00%
clearGeneFeatures(SequenceI) : void clearGeneFeatures(SequenceI) : void	313313	4.04	1.01	4.04	0.0 0.00%
makeTranscript(SequenceFeature,AlignmentI,SequenceI) : SequenceI makeTranscript(SequenceFeature,AlignmentI,SequenceI) : SequenceI	345345	40.040	6.06	48.048	0.0 0.00%
mapTranscriptToChromosome(SequenceI,SequenceI,MapList) : void mapTranscriptToChromosome(SequenceI,SequenceI,MapList) : void	456456	11.011	2.02	13.013	0.0 0.00%
getTranscriptId(SequenceFeature) : String getTranscriptId(SequenceFeature) : String	489489	1.01	1.01	1.01	0.0 0.00%
getTranscriptFeatures(String,SequenceI) : List<SequenceFeature> getTranscriptFeatures(String,SequenceI) : List<SequenceFeature>	508508	9.09	2.02	0.00	1.0 1.0100%
getDescription() : String getDescription() : String	532532	1.01	1.01	1.01	0.0 0.00%
getTestQuery() : String getTestQuery() : String	541541	1.01	1.01	1.01	0.0 0.00%
identifiesSequence(SequenceFeature,String) : boolean identifiesSequence(SequenceFeature,String) : boolean	554554	5.05	3.03	0.00	1.0 1.0100%
retainFeature(SequenceFeature,String) : boolean retainFeature(SequenceFeature,String) : boolean	577577	9.09	4.04	0.00	1.0 1.0100%
isSpliceable() : boolean isSpliceable() : boolean	602602	1.01	1.01	0.00	1.0 1.0100%
addProteinProduct(SequenceI) : void addProteinProduct(SequenceI) : void	612612	0.00	1.01	0.00	-1.0 -1.0 -
getAccessionValidator() : Regex getAccessionValidator() : Regex	617617	1.01	1.01	1.01	0.0 0.00%
isFeatureDisplayed(String) : boolean isFeatureDisplayed(String) : boolean	640640	1.01	1.01	0.00	1.0 1.0100%
isColourByLabel() : boolean isColourByLabel() : boolean	654654	1.01	1.01	0.00	1.0 1.0100%
getColour() : Color getColour() : Color	666666	1.01	1.01	0.00	1.0 1.0100%
getFeatureColour(String) : FeatureColourI getFeatureColour(String) : FeatureColourI	647647	5.05	3.03	2.02	0.7777778 0.777777877.8%
compare(String,String) : int compare(String,String) : int	679679	9.09	5.05	10.010	0.4117647 0.411764741.2%
getFeatureColourScheme() : FeatureSettingsModelI getFeatureColourScheme() : FeatureSettingsModelI	633633	1.01	1.01	0.00	1.0 1.0100%

Contributing tests

This file is covered by 85 tests. .

Contributing tests

Test contribution	Test	Result
0.10612245	jalview.ext.ensembl.EnsemblGeneTest.testGetFeatureColourSchemejalview.ext.ensembl.EnsemblGeneTest.testGetFeatureColourScheme	1PASS
0.073469386	jalview.ext.ensembl.EnsemblGeneTest.testRetainFeaturejalview.ext.ensembl.EnsemblGeneTest.testRetainFeature	1PASS
0.057142857	jalview.ext.ensembl.EnsemblGeneTest.testGetTranscriptFeaturesjalview.ext.ensembl.EnsemblGeneTest.testGetTranscriptFeatures	1PASS
0.04897959	jalview.ext.ensembl.EnsemblGeneTest.testIdentifiesSequencejalview.ext.ensembl.EnsemblGeneTest.testIdentifiesSequence	1PASS
0.04489796	jalview.ext.ensembl.EnsemblGeneTest.testGetGenomicRangesFromFeatures_ncRNA_gene_reverseStrandjalview.ext.ensembl.EnsemblGeneTest.testGetGenomicRangesFromFeatures_ncRNA_gene_reverseStrand	1PASS
0.04489796	jalview.ext.ensembl.EnsemblGeneTest.testGetGenomicRangesFromFeaturesjalview.ext.ensembl.EnsemblGeneTest.testGetGenomicRangesFromFeatures	1PASS
0.01632653	jalview.analysis.CrossRefTest.testFindXrefSequences_uniprotEmblManyToManyjalview.analysis.CrossRefTest.testFindXrefSequences_uniprotEmblManyToMany	3FAIL
0.01632653	jalview.analysis.CrossRefTest.testFindXrefSequences_withFetchjalview.analysis.CrossRefTest.testFindXrefSequences_withFetch	3FAIL
0.01632653	jalview.analysis.CrossRefTest.testFindXrefSequences_forGeneAndTranscriptsjalview.analysis.CrossRefTest.testFindXrefSequences_forGeneAndTranscripts	3FAIL
0.01632653	jalview.ws.seqfetcher.DbRefFetcherTest.testStandardProtDbsjalview.ws.seqfetcher.DbRefFetcherTest.testStandardProtDbs	1PASS
0.008163265	jalview.ext.rbvi.chimera.ChimeraCommandsTest.testGetColourBySequenceCommands_hiddenColumnsjalview.ext.rbvi.chimera.ChimeraCommandsTest.testGetColourBySequenceCommands_hiddenColumns	1PASS
0.008163265	jalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommand_noFeaturesjalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommand_noFeatures	1PASS
0.008163265	jalview.gui.PaintRefresherTest.testRemoveComponentjalview.gui.PaintRefresherTest.testRemoveComponent	1PASS
0.008163265	jalview.structure.StructureSelectionManagerTest.testSetMapping_seqFeaturesjalview.structure.StructureSelectionManagerTest.testSetMapping_seqFeatures	1PASS
0.008163265	jalview.datamodel.SeqCigarTest.testSomethingjalview.datamodel.SeqCigarTest.testSomething	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testSelectType_showForAlljalview.gui.AnnotationChooserTest.testSelectType_showForAll	1PASS
0.008163265	jalview.analysis.SeqsetUtilsTest.testSeqFeatureAdditionjalview.analysis.SeqsetUtilsTest.testSeqFeatureAddition	1PASS
0.008163265	jalview.gui.FeatureSettingsTest.testGetColorTooltipjalview.gui.FeatureSettingsTest.testGetColorTooltip	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testStoreAndRecoverExpandedviewsjalview.io.Jalview2xmlTests.testStoreAndRecoverExpandedviews	1PASS
0.008163265	jalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumnjalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumn	1PASS
0.008163265	jalview.gui.AlignFrameTest.testNewView_colourThresholdsjalview.gui.AlignFrameTest.testNewView_colourThresholds	1PASS
0.008163265	jalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumnsjalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumns	1PASS
0.008163265	jalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_withAnnotationsjalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_withAnnotations	1PASS
0.008163265	jalview.io.FeaturesFileTest.testParsejalview.io.FeaturesFileTest.testParse	1PASS
0.008163265	jalview.io.FileFormatsTest.testDeregisterFileFormatjalview.io.FileFormatsTest.testDeregisterFileFormat	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testResetOriginalStatejalview.gui.AnnotationChooserTest.testResetOriginalState	1PASS
0.008163265	jalview.controller.AlignViewControllerTest.testFindColumnsWithFeaturejalview.controller.AlignViewControllerTest.testFindColumnsWithFeature	1PASS
0.008163265	jalview.analysis.AnnotationSorterTest.testNoSort_autocalcFirstjalview.analysis.AnnotationSorterTest.testNoSort_autocalcFirst	1PASS
0.008163265	jalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsqjalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsq	1PASS
0.008163265	jalview.io.vcf.VCFLoaderTest.testDoLoadjalview.io.vcf.VCFLoaderTest.testDoLoad	1PASS
0.008163265	jalview.gui.AlignFrameTest.testChangeColour_background_groupsAndThresholdsjalview.gui.AlignFrameTest.testChangeColour_background_groupsAndThresholds	1PASS
0.008163265	jalview.gui.PopupMenuTest.testAddFeatureLinksjalview.gui.PopupMenuTest.testAddFeatureLinks	3FAIL
0.008163265	jalview.gui.AlignViewportTest.testSetSelectionGroupjalview.gui.AlignViewportTest.testSetSelectionGroup	1PASS
0.008163265	jalview.io.JalviewExportPropertiesTests.testImportExportPeriodGapsjalview.io.JalviewExportPropertiesTests.testImportExportPeriodGaps	1PASS
0.008163265	jalview.datamodel.AlignedCodonFrameTest.testAddMapjalview.datamodel.AlignedCodonFrameTest.testAddMap	1PASS
0.008163265	jalview.datamodel.ColumnSelectionTest.testRemoveElementjalview.datamodel.ColumnSelectionTest.testRemoveElement	1PASS
0.008163265	jalview.renderer.seqfeatures.FeatureRendererTest.testGetColourjalview.renderer.seqfeatures.FeatureRendererTest.testGetColour	1PASS
0.008163265	jalview.gui.AlignFrameTest.testColourThresholdActionsjalview.gui.AlignFrameTest.testColourThresholdActions	1PASS
0.008163265	jalview.gui.AlignViewportTest.testShowOrDontShowOccupancyjalview.gui.AlignViewportTest.testShowOrDontShowOccupancy	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testBuildApplyToOptionsPanel_withSelectionGroupjalview.gui.AnnotationChooserTest.testBuildApplyToOptionsPanel_withSelectionGroup	1PASS
0.008163265	jalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMoljalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMol	1PASS
0.008163265	jalview.io.Jalview2xmlTests.gatherViewsHerejalview.io.Jalview2xmlTests.gatherViewsHere	1PASS
0.008163265	jalview.gui.PopupMenuTest.testConfigureReferenceAnnotationsMenujalview.gui.PopupMenuTest.testConfigureReferenceAnnotationsMenu	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testSaveLoadFeatureColoursAndFiltersjalview.io.Jalview2xmlTests.testSaveLoadFeatureColoursAndFilters	1PASS
0.008163265	jalview.analysis.FinderTest.testFindAll_regexjalview.analysis.FinderTest.testFindAll_regex	1PASS
0.008163265	jalview.structure.StructureSelectionManagerTest.testRegisterMappingjalview.structure.StructureSelectionManagerTest.testRegisterMapping	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettingsjalview.io.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettings	1PASS
0.008163265	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParamsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParams	1PASS
0.008163265	jalview.gui.PopupMenuTest.testConfigureReferenceAnnotationsMenu_twoViewsjalview.gui.PopupMenuTest.testConfigureReferenceAnnotationsMenu_twoViews	1PASS
0.008163265	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumnjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumn	1PASS
0.008163265	jalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeaturesjalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeatures	1PASS
0.008163265	jalview.gui.AlignViewportTest.testDeregisterMapping_withReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withReference	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testCopyViewSettingsjalview.io.Jalview2xmlTests.testCopyViewSettings	1PASS
0.008163265	jalview.gui.AlignFrameTest.testHideFeatureColumnsjalview.gui.AlignFrameTest.testHideFeatureColumns	1PASS
0.008163265	jalview.util.ParseHtmlBodyAndLinksTest.testParseHtml_noLinksjalview.util.ParseHtmlBodyAndLinksTest.testParseHtml_noLinks	1PASS
0.008163265	jalview.gui.AlignViewportTest.testDeregisterMapping_onCloseViewjalview.gui.AlignViewportTest.testDeregisterMapping_onCloseView	1PASS
0.008163265	jalview.gui.AlignViewportTest.testDeregisterMapping_withNoReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withNoReference	1PASS
0.008163265	jalview.gui.HelpTest.checkHelpTargetsjalview.gui.HelpTest.checkHelpTargets	1PASS
0.008163265	jalview.gui.PaintRefresherTest.testGetAssociatedPanelsjalview.gui.PaintRefresherTest.testGetAssociatedPanels	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testStoreAndRecoverPDBEntryjalview.io.Jalview2xmlTests.testStoreAndRecoverPDBEntry	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqsjalview.io.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqs	1PASS
0.008163265	jalview.io.Jalview2xmlTests.viewRefPdbAnnotationjalview.io.Jalview2xmlTests.viewRefPdbAnnotation	1PASS
0.008163265	jalview.gui.AlignViewportTest.testSetGetHasSearchResultsjalview.gui.AlignViewportTest.testSetGetHasSearchResults	1PASS
0.008163265	jalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignmentjalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignment	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testTCoffeeScoresjalview.io.Jalview2xmlTests.testTCoffeeScores	1PASS
0.008163265	jalview.io.Jalview2xmlTests.noDuplicatePdbMappingsMadejalview.io.Jalview2xmlTests.noDuplicatePdbMappingsMade	1PASS
0.008163265	jalview.io.JalviewFileViewTest.testGetExtensionjalview.io.JalviewFileViewTest.testGetExtension	1PASS
0.008163265	jalview.datamodel.ColumnSelectionTest.testMinColumnSelectionjalview.datamodel.ColumnSelectionTest.testMinColumnSelection	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testRNAStructureRecoveryjalview.io.Jalview2xmlTests.testRNAStructureRecovery	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testSelectType_hideForAlljalview.gui.AnnotationChooserTest.testSelectType_hideForAll	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testIsInActionScope_unselectedScopejalview.gui.AnnotationChooserTest.testIsInActionScope_unselectedScope	1PASS
0.008163265	jalview.structure.StructureSelectionManagerTest.testRegisterMappingsjalview.structure.StructureSelectionManagerTest.testRegisterMappings	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testDeselectType_hideForAlljalview.gui.AnnotationChooserTest.testDeselectType_hideForAll	1PASS
0.008163265	jalview.gui.FeatureSettingsTest.testSaveLoadjalview.gui.FeatureSettingsTest.testSaveLoad	1PASS
0.008163265	jalview.io.FeaturesFileTest.testPrintGffFormatjalview.io.FeaturesFileTest.testPrintGffFormat	1PASS
0.008163265	jalview.io.vcf.VCFLoaderTest.testLoadVCFContigjalview.io.vcf.VCFLoaderTest.testLoadVCFContig	1PASS
0.008163265	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumnsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumns	1PASS
0.008163265	jalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotationjalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotation	1PASS
0.008163265	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistancesjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances	1PASS
0.008163265	jalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroupjalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroup	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testGetAnnotationTypesjalview.gui.AnnotationChooserTest.testGetAnnotationTypes	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testStoreAndRecoverColourThresholdsjalview.io.Jalview2xmlTests.testStoreAndRecoverColourThresholds	1PASS
0.008163265	jalview.gui.AnnotationColumnChooserTest.testResetjalview.gui.AnnotationColumnChooserTest.testReset	1PASS
0.008163265	jalview.gui.AnnotationChooserTest.testBuildActionButtonsPaneljalview.gui.AnnotationChooserTest.testBuildActionButtonsPanel	1PASS
0.008163265	jalview.io.Jalview2xmlTests.testColourByAnnotScoresjalview.io.Jalview2xmlTests.testColourByAnnotScores	1PASS

Source view

* Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)

* Copyright (C) $$Year-Rel$$ The Jalview Authors

* This file is part of Jalview.

* Jalview is free software: you can redistribute it and/or

* modify it under the terms of the GNU General Public License

* as published by the Free Software Foundation, either version 3

* of the License, or (at your option) any later version.

* Jalview is distributed in the hope that it will be useful, but

* WITHOUT ANY WARRANTY; without even the implied warranty

* of MERCHANTABILITY or FITNESS FOR A PARTICULAR

* PURPOSE. See the GNU General Public License for more details.

* You should have received a copy of the GNU General Public License

* along with Jalview. If not, see <http://www.gnu.org/licenses/>.

* The Jalview Authors are detailed in the 'AUTHORS' file.

package jalview.ext.ensembl;

import jalview.api.FeatureColourI;

import jalview.api.FeatureSettingsModelI;

import jalview.datamodel.AlignmentI;

import jalview.datamodel.DBRefEntry;

import jalview.datamodel.GeneLociI;

import jalview.datamodel.Sequence;

import jalview.datamodel.SequenceFeature;

import jalview.datamodel.SequenceI;

import jalview.datamodel.features.SequenceFeatures;

import jalview.io.gff.SequenceOntologyFactory;

import jalview.io.gff.SequenceOntologyI;

import jalview.schemes.FeatureColour;

import jalview.schemes.FeatureSettingsAdapter;

import jalview.util.MapList;

import java.awt.Color;

import java.io.UnsupportedEncodingException;

import java.net.URLDecoder;

import java.util.ArrayList;

import java.util.Arrays;

import java.util.List;

import com.stevesoft.pat.Regex;

/**

* A class that fetches genomic sequence and all transcripts for an Ensembl gene

* @author gmcarstairs

public class EnsemblGene extends EnsemblSeqProxy

{

private static final String GENE_PREFIX = "gene:";

* accepts anything as we will attempt lookup of gene or

* transcript id or gene name

private static final Regex ACCESSION_REGEX = new Regex(".*");

private static final EnsemblFeatureType[] FEATURES_TO_FETCH = {

EnsemblFeatureType.gene, EnsemblFeatureType.transcript,

EnsemblFeatureType.exon, EnsemblFeatureType.cds,

EnsemblFeatureType.variation };

/**

* Default constructor (to use rest.ensembl.org)

public EnsemblGene()

{

super();

}

/**

* Constructor given the target domain to fetch data from

* @param d

public EnsemblGene(String d)

{

super(d);

}

1108

@Override

public String getDbName()

{

1108

return "ENSEMBL";

}

@Override

protected EnsemblFeatureType[] getFeaturesToFetch()

{

return FEATURES_TO_FETCH;

}

@Override

protected EnsemblSeqType getSourceEnsemblType()

{

100

return EnsemblSeqType.GENOMIC;

}

@Override

protected String getObjectType()

105

{

106

return OBJECT_TYPE_GENE;

}

/**

* Returns an alignment containing the gene(s) for the given gene or

111

* transcript identifier, or external identifier (e.g. Uniprot id). If given a

112

* gene name or external identifier, returns any related gene sequences found

113

* for model organisms. If only a single gene is queried for, then its

114

* transcripts are also retrieved and added to the alignment. <br>

115

* Method:

116

* <ul>

117

* <li>resolves a transcript identifier by looking up its parent gene id</li>

118

* <li>resolves an external identifier by looking up xref-ed gene ids</li>

119

* <li>fetches the gene sequence</li>

120

* <li>fetches features on the sequence</li>

121

* <li>identifies "transcript" features whose Parent is the requested

122

* gene</li>

123

* <li>fetches the transcript sequence for each transcript</li>

124

* <li>makes a mapping from the gene to each transcript</li>

125

* <li>copies features from gene to transcript sequences</li>

126

* <li>fetches the protein sequence for each transcript, maps and saves it as

127

* a cross-reference</li>

128

* <li>aligns each transcript against the gene sequence based on the position

* mappings</li>

* </ul>

* @param query

* a single gene or transcript identifier or gene name

134

* @return an alignment containing a gene, and possibly transcripts, or null

135

136

@Override

137

public AlignmentI getSequenceRecords(String query) throws Exception

138

{

139

140

* convert to a non-duplicated list of gene identifiers

141

142

List<String> geneIds = getGeneIds(query);

143

144

AlignmentI al = null;

145

for (String geneId : geneIds)

146

{

147

148

* fetch the gene sequence(s) with features and xrefs

149

150

AlignmentI geneAlignment = super.getSequenceRecords(geneId);

151

if (geneAlignment == null)

{

continue;

}

if (geneAlignment.getHeight() == 1)

157

{

158

// ensure id has 'correct' case for the Ensembl identifier

159

geneId = geneAlignment.getSequenceAt(0).getName();

160

161

findGeneLoci(geneAlignment.getSequenceAt(0), geneId);

162

163

getTranscripts(geneAlignment, geneId);

}

if (al == null)

{

al = geneAlignment;

}

else

{

al.append(geneAlignment);

}

}

return al;

}

/**

* Calls the /lookup/id REST service, parses the response for gene

179

* coordinates, and if successful, adds these to the sequence. If this fails,

180

* fall back on trying to parse the sequence description in case it is in

181

* Ensembl-gene format e.g. chromosome:GRCh38:17:45051610:45109016:1.

* @param seq

* @param geneId

void findGeneLoci(SequenceI seq, String geneId)

187

{

188

GeneLociI geneLoci = new EnsemblLookup(getDomain()).getGeneLoci(geneId);

189

if (geneLoci != null)

190

{

191

seq.setGeneLoci(geneLoci.getSpeciesId(), geneLoci.getAssemblyId(),

192

geneLoci.getChromosomeId(), geneLoci.getMap());

}

else

{

parseChromosomeLocations(seq);

}

}

/**

* Parses and saves fields of an Ensembl-style description e.g.

202

* chromosome:GRCh38:17:45051610:45109016:1

* @param seq

boolean parseChromosomeLocations(SequenceI seq)

207

{

208

String description = seq.getDescription();

209

if (description == null)

{

return false;

}

String[] tokens = description.split(":");

214

if (tokens.length == 6 && tokens[0].startsWith(DBRefEntry.CHROMOSOME))

215

{

216

String ref = tokens[1];

217

String chrom = tokens[2];

218

try

219

{

220

int chStart = Integer.parseInt(tokens[3]);

221

int chEnd = Integer.parseInt(tokens[4]);

222

boolean forwardStrand = "1".equals(tokens[5]);

223

String species = ""; // not known here

224

int[] from = new int[] { seq.getStart(), seq.getEnd() };

225

int[] to = new int[] { forwardStrand ? chStart : chEnd,

226

forwardStrand ? chEnd : chStart };

227

MapList map = new MapList(from, to, 1, 1);

228

seq.setGeneLoci(species, ref, chrom, map);

229

return true;

230

} catch (NumberFormatException e)

231

{

232

System.err.println("Bad integers in description " + description);

}

}

return false;

}

/**

* Converts a query, which may contain one or more gene, transcript, or

240

* external (to Ensembl) identifiers, into a non-redundant list of gene

* identifiers.

* @param accessions

* @return

List<String> getGeneIds(String accessions)

247

{

248

List<String> geneIds = new ArrayList<>();

249

250

for (String acc : accessions.split(getAccessionSeparator()))

251

{

252

253

* First try lookup as an Ensembl (gene or transcript) identifier

254

255

String geneId = new EnsemblLookup(getDomain()).getGeneId(acc);

256

if (geneId != null)

257

{

258

if (!geneIds.contains(geneId))

{

geneIds.add(geneId);

}

}

else

{

* if given a gene or other external name, lookup and fetch

267

* the corresponding gene for all model organisms

268

269

List<String> ids = new EnsemblSymbol(getDomain(), getDbSource(),

270

getDbVersion()).getGeneIds(acc);

271

for (String id : ids)

272

{

273

if (!geneIds.contains(id))

{

geneIds.add(id);

}

}

}

}

return geneIds;

}

/**

* Constructs all transcripts for the gene, as identified by "transcript"

285

* features whose Parent is the requested gene. The coding transcript

286

* sequences (i.e. with introns omitted) are added to the alignment.

* @param al

* @param accId

* @throws Exception

protected void getTranscripts(AlignmentI al, String accId)

293

throws Exception

294

{

295

SequenceI gene = al.getSequenceAt(0);

296

List<SequenceFeature> transcriptFeatures = getTranscriptFeatures(accId,

297

gene);

298

299

for (SequenceFeature transcriptFeature : transcriptFeatures)

300

{

301

makeTranscript(transcriptFeature, al, gene);

302

}

303

304

clearGeneFeatures(gene);

}

/**

* Remove unwanted features (transcript, exon, CDS) from the gene sequence

309

* after we have used them to derive transcripts and transfer features

* @param gene

protected void clearGeneFeatures(SequenceI gene)

314

{

315

316

* Note we include NMD_transcript_variant here because it behaves like

317

* 'transcript' in Ensembl, although strictly speaking it is not

318

* (it is a sub-type of sequence_variant)

319

320

String[] soTerms = new String[] {

321

SequenceOntologyI.NMD_TRANSCRIPT_VARIANT,

322

SequenceOntologyI.TRANSCRIPT, SequenceOntologyI.EXON,

323

SequenceOntologyI.CDS };

324

List<SequenceFeature> sfs = gene.getFeatures().getFeaturesByOntology(

325

soTerms);

326

for (SequenceFeature sf : sfs)

327

{

328

gene.deleteFeature(sf);

}

}

/**

* Constructs a spliced transcript sequence by finding 'exon' features for the

334

* given id (or failing that 'CDS'). Copies features on to the new sequence.

335

* 'Aligns' the new sequence against the gene sequence by padding with gaps,

336

* and adds it to the alignment.

337

338

* @param transcriptFeature

339

* @param al

340

* the alignment to which to add the new sequence

341

* @param gene

342

* the parent gene sequence, with features

343

* @return

344

345

SequenceI makeTranscript(SequenceFeature transcriptFeature, AlignmentI al,

346

SequenceI gene)

347

{

348

String accId = getTranscriptId(transcriptFeature);

if (accId == null)

{

return null;

}

* NB we are mapping from gene sequence (not genome), so do not

356

* need to check for reverse strand (gene and transcript sequences

357

* are in forward sense)

* make a gene-length sequence filled with gaps

362

* we will fill in the bases for transcript regions

363

364

char[] seqChars = new char[gene.getLength()];

365

Arrays.fill(seqChars, al.getGapCharacter());

366

367

368

* look for exon features of the transcript, failing that for CDS

369

* (for example ENSG00000124610 has 1 CDS but no exon features)

370

371

String parentId = "transcript:" + accId;

372

List<SequenceFeature> splices = findFeatures(gene,

373

SequenceOntologyI.EXON, parentId);

374

if (splices.isEmpty())

375

{

376

splices = findFeatures(gene, SequenceOntologyI.CDS, parentId);

377

}

378

SequenceFeatures.sortFeatures(splices, true);

379

380

int transcriptLength = 0;

381

final char[] geneChars = gene.getSequence();

382

int offset = gene.getStart(); // to convert to 0-based positions

383

List<int[]> mappedFrom = new ArrayList<>();

384

385

for (SequenceFeature sf : splices)

386

{

387

int start = sf.getBegin() - offset;

388

int end = sf.getEnd() - offset;

389

int spliceLength = end - start + 1;

390

System.arraycopy(geneChars, start, seqChars, start, spliceLength);

391

transcriptLength += spliceLength;

392

mappedFrom.add(new int[] { sf.getBegin(), sf.getEnd() });

393

}

394

395

Sequence transcript = new Sequence(accId, seqChars, 1,

transcriptLength);

* Ensembl has gene name as transcript Name

400

* EnsemblGenomes doesn't, but has a url-encoded description field

401

402

String description = (String) transcriptFeature.getValue(NAME);

403

if (description == null)

404

{

405

description = (String) transcriptFeature.getValue(DESCRIPTION);

406

}

407

if (description != null)

{

try

{

transcript.setDescription(URLDecoder.decode(description, "UTF-8"));

412

} catch (UnsupportedEncodingException e)

413

{

414

e.printStackTrace(); // as if

415

}

416

}

417

transcript.createDatasetSequence();

418

419

al.addSequence(transcript);

420

421

422

* transfer features to the new sequence; we use EnsemblCdna to do this,

423

* to filter out unwanted features types (see method retainFeature)

424

425

List<int[]> mapTo = new ArrayList<>();

426

mapTo.add(new int[] { 1, transcriptLength });

427

MapList mapping = new MapList(mappedFrom, mapTo, 1, 1);

428

EnsemblCdna cdna = new EnsemblCdna(getDomain());

429

cdna.transferFeatures(gene.getFeatures().getPositionalFeatures(),

430

transcript.getDatasetSequence(), mapping, parentId);

431

432

mapTranscriptToChromosome(transcript, gene, mapping);

433

434

435

* fetch and save cross-references

436

437

cdna.getCrossReferences(transcript);

438

439

440

* and finally fetch the protein product and save as a cross-reference

441

442

cdna.addProteinProduct(transcript);

return transcript;

}

/**

* If the gene has a mapping to chromosome coordinates, derive the transcript

449

* chromosome regions and save on the transcript sequence

* @param transcript

* @param gene

* @param mapping

* the mapping from gene to transcript positions

455

456

protected void mapTranscriptToChromosome(SequenceI transcript,

457

SequenceI gene, MapList mapping)

458

{

459

GeneLociI loci = gene.getGeneLoci();

if (loci == null)

{

return;

}

MapList geneMapping = loci.getMap();

466

467

List<int[]> exons = mapping.getFromRanges();

468

List<int[]> transcriptLoci = new ArrayList<>();

469

470

for (int[] exon : exons)

471

{

472

transcriptLoci.add(geneMapping.locateInTo(exon[0], exon[1]));

473

}

474

475

List<int[]> transcriptRange = Arrays.asList(new int[] {

476

transcript.getStart(), transcript.getEnd() });

477

MapList mapList = new MapList(transcriptRange, transcriptLoci, 1, 1);

478

479

transcript.setGeneLoci(loci.getSpeciesId(), loci.getAssemblyId(),

480

loci.getChromosomeId(), mapList);

}

/**

* Returns the 'transcript_id' property of the sequence feature (or null)

* @param feature

* @return

protected String getTranscriptId(SequenceFeature feature)

490

{

491

return (String) feature.getValue("transcript_id");

}

/**

* Returns a list of the transcript features on the sequence whose Parent is

496

* the gene for the accession id.

497

* <p>

498

* Transcript features are those of type "transcript", or any of its sub-types

499

* in the Sequence Ontology e.g. "mRNA", "processed_transcript". We also

500

* include "NMD_transcript_variant", because this type behaves like a

501

* transcript identifier in Ensembl, although strictly speaking it is not in

* the SO.

* @param accId

* @param geneSequence

506

* @return

507

508

protected List<SequenceFeature> getTranscriptFeatures(String accId,

509

SequenceI geneSequence)

510

{

511

List<SequenceFeature> transcriptFeatures = new ArrayList<>();

512

513

String parentIdentifier = GENE_PREFIX + accId;

514

515

List<SequenceFeature> sfs = geneSequence.getFeatures()

516

.getFeaturesByOntology(SequenceOntologyI.TRANSCRIPT);

517

sfs.addAll(geneSequence.getFeatures().getPositionalFeatures(

518

SequenceOntologyI.NMD_TRANSCRIPT_VARIANT));

519

520

for (SequenceFeature sf : sfs)

521

{

522

String parent = (String) sf.getValue(PARENT);

523

if (parentIdentifier.equalsIgnoreCase(parent))

524

{

525

transcriptFeatures.add(sf);

}

}

return transcriptFeatures;

}

@Override

public String getDescription()

534

{

535

return "Fetches all transcripts and variant features for a gene or transcript";

}

/**

* Default test query is a gene id (can also enter a transcript id)

540

541

@Override

542

public String getTestQuery()

543

{

544

return "ENSG00000157764"; // BRAF, 5 transcripts, reverse strand

545

// ENSG00000090266 // NDUFB2, 15 transcripts, forward strand

546

// ENSG00000101812 // H2BFM histone, 3 transcripts, forward strand

547

// ENSG00000123569 // H2BFWT histone, 2 transcripts, reverse strand

}

/**

* Answers true for a feature of type 'gene' (or a sub-type of gene in the

552

* Sequence Ontology), whose ID is the accession we are retrieving

553

554

@Override

555

protected boolean identifiesSequence(SequenceFeature sf, String accId)

556

{

557

if (SequenceOntologyFactory.getInstance().isA(sf.getType(),

558

SequenceOntologyI.GENE))

559

{

560

// NB features as gff use 'ID'; rest services return as 'id'

561

String id = (String) sf.getValue("ID");

562

if ((GENE_PREFIX + accId).equalsIgnoreCase(id))

{

return true;

}

}

return false;

}

/**

* Answers true unless feature type is 'gene', or 'transcript' with a parent

572

* which is a different gene. We need the gene features to identify the range,

573

* but it is redundant information on the gene sequence. Checking the parent

574

* allows us to drop transcript features which belong to different

575

* (overlapping) genes.

576

577

@Override

578

protected boolean retainFeature(SequenceFeature sf, String accessionId)

579

{

580

SequenceOntologyI so = SequenceOntologyFactory.getInstance();

581

String type = sf.getType();

582

if (so.isA(type, SequenceOntologyI.GENE))

{

return false;

}

if (isTranscript(type))

587

{

588

String parent = (String) sf.getValue(PARENT);

589

if (!(GENE_PREFIX + accessionId).equalsIgnoreCase(parent))

{

return false;

}

}

return true;

}

/**

* Answers false. This allows an optimisation - a single 'gene' feature is all

599

* that is needed to identify the positions of the gene on the genomic

* sequence.

@Override

protected boolean isSpliceable()

{

return false;

}

/**

* Override to do nothing as Ensembl doesn't return a protein sequence for a

* gene identifier

@Override

protected void addProteinProduct(SequenceI querySeq)

{

}

@Override

public Regex getAccessionValidator()

619

{

620

return ACCESSION_REGEX;

}

/**

* Returns a descriptor for suitable feature display settings with

625

* <ul>

626

* <li>only exon or sequence_variant features (or their subtypes in the

627

* Sequence Ontology) visible</li>

628

* <li>variant features coloured red</li>

629

* <li>exon features coloured by label (exon name)</li>

630

* <li>variants displayed above (on top of) exons</li>

* </ul>

@Override

public FeatureSettingsModelI getFeatureColourScheme()

635

{

636

return new FeatureSettingsAdapter()

637

{

638

SequenceOntologyI so = SequenceOntologyFactory.getInstance();

639

640

@Override

641

public boolean isFeatureDisplayed(String type)

642

{

643

return (so.isA(type, SequenceOntologyI.EXON)

644

|| so.isA(type, SequenceOntologyI.SEQUENCE_VARIANT));

}

@Override

public FeatureColourI getFeatureColour(String type)

649

{

650

if (so.isA(type, SequenceOntologyI.EXON))

651

{

652

return new FeatureColour()

653

{

654

@Override

655

public boolean isColourByLabel()

{

return true;

}

};

}

if (so.isA(type, SequenceOntologyI.SEQUENCE_VARIANT))

662

{

663

return new FeatureColour()

{

@Override

public Color getColour()

{

return Color.RED;

}

};

}

return null;

}

/**

* order to render sequence_variant after exon after the rest

678

679

@Override

680

public int compare(String feature1, String feature2)

681

{

682

if (so.isA(feature1, SequenceOntologyI.SEQUENCE_VARIANT))

{

return +1;

}

if (so.isA(feature2, SequenceOntologyI.SEQUENCE_VARIANT))

{

return -1;

}

if (so.isA(feature1, SequenceOntologyI.EXON))

{

return +1;

}

if (so.isA(feature2, SequenceOntologyI.EXON))

{

return -1;

}

return 0;

}

};

}

}

jalviewX

File EnsemblGene.java

Coverage histogram

Code metrics

Classes

Class EnsemblGene

Contributing tests

Contributing tests

Source view